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出版说明 


由香港科技大学社会科学部吴晓刚教授主编的“格致方 
法 • 定量研究系列”丛书，精选了世界著名的 SAGE 出版社 
定量社会科学研究丛书中的35种，翻译成中文，集结成八 
册，于2011年出版。这八册书分 别是: 《线性回归分析基 
础》、《高级回归分析》、《广义线性模型》、《纵贯数据分析》、 
《因果关系模型》、《社会科学中的数理基础及应用》、《数据分 
析方法五种》和《列表数据分析》。这套丛书自出版以来，受 
到广大读者特别是年轻一代社会科学工作者的欢迎，他们针 
对丛书的内容和翻译都提岀了很多中肯的建议。我们对此 
表示衷心的感谢。 

基于读者的热烈反馈，同时也为了向广大读者提供更多 
的方便和选择，我们将该丛书以单行本的形式再次出版发行。 
在此过程中，主编和译者对已岀版的书做了必要的修订和校 
正，还新增加了两个品种。此外，曾东林、许多多、范新光、李 
忠路协助主编参加了校订。今后我们将继续与 SAGE 出版社 
合作，陆续推出新的品种。我们希望本丛书单行本的出版能 
为推动国内社会科学定量研究的教学和研究作出一点贡献。 





总序 



往事如烟，光阴如梭。转眼间，出国已然十年有余。 
1996年赴美留学，最初选择的主攻方向是比较历史社会学， 
研究的兴趣是中国的制度变迁问题。以我以前在国内所受 
的学术训练，基本是看不上定量研究的。一方面，我们倾向 
于研究大问题，不喜欢纠缠于细枝末节。国内一位老师的 
话给我的印象很深，大致是说 :如果 你看到一堵墙就要倒 
了，还用得着纠缠于那堵墙的倾斜角度究竟是几度吗？所 
以，很多研究都是大而化之，只要说得通即可。另一方面， 
国内（十年前)的统计教学，总的来说与社会研究中的实际 
问题是相脱节的。结果是，很多原先对定量研究感兴趣的 
学生在学完统计之后，依旧无从下手，逐渐失去了对定量研 
究的兴趣。 

我所就读的美国加州大学洛杉矶分校社会学系，在定量 
研究方面有着系统的博士训练课程。不论研究兴趣是定量 
还是定性的，所有的研究生第一年的头两个学期必须修两门 
中级统计课，最后一个学期的系列课程则是简单介绍线性回 
归以外的其他统计方法，是选修课。希望进一步学习定量研 
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究方法的可以在第二年修读另外一个三学期的系列课程，其 
中头两门课叫“调查数据分析”，第三门叫“研究设计”。除此 
以外，还有如“定类数据分析”、“人口学方法与技术”、“事件 
史分析”、“多层线性模型”等专门课程供学生选修。该学校 
的统计系、心理系、教育系、经济系也有一批蜚声国际的学 
者，提供不同的、更加专业化的课程供学生选修。2001年完 
成博士学业之后，我又受安德鲁 • 梅隆基金会资助，在世界 
定量社会科学研究的重镇密歇根大学从事两年的博士后研 
究，其间旁听谢宇教授为博士生讲授的统计课程，并参与该 
校社会研究院 (Institute for Social Research ) 定量社会研究方 

法项目的一些讨论会，受益良多。 

2003年，我赴港工作，在香港科技大学社会科学部，教授 
研究生的两门核心定量方法课程。香港科技大学社会科学 
部自创建以来，非常重视社会科学研究方法论的训练。我开 
设的第一门课“社会科学里的统计学 ” （Statistics for Social 
Science ) 为所有研究型硕士生和博士生的必修课，而第二门 
课“社会科学中的定量分析”为博士生的必修课 (事 实上，大 
部分硕士生在修完第一门课后都会继续选修第二门课)。我 
在讲授这两门课的时候，根据社会科学研究生的数理基础比 
较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的 
例子，结合语言和图形，帮助学生理解统计的基本概念和模 
型。课程的重点放在如何应用定量分析模型研究社会实际 
问题上，即社会研究者主要为定量统计方法的“消费者”而非 
“生产者”。作为“消费者”，学完这些课程后，我们一方面能 
够读懂、欣赏和评价别人在同行评议的刊物上发表的定量研 
究的 文章; 另一方面，也能在自己的研究中运用这些成熟的 



方法论技术。 

上述两门课的内容，尽管在线性回归模型的内容上有 
少量重复，但各有侧重。“社会科学里的统计学 ” (Statistics 
for Social Science ) 从介绍最基本的社会研究方法论和统计 
学原理开始，到多元线性回归模型结束，内容涵盖了描述性 
统计的基本方法、统计推论的原理、假设检验、列联表分析、 
方差和协方差分析、简单线性回归模型、多元线性回归模 
型，以及线性回归模型的假设和模型诊断。“社会科学中 
的定量分析”则介绍在经典线性回归模型的假设不成立的 
情况下的一些模型和方法，将重点放在因变量为定类数据 
的分析模型上，包括两分类的 logistic 回归模型、多分类 lo ¬ 
gistic 回归模型、定序 logistic 回归模型、条件 logistic 回归模 
型、多维列联表的对数线性和对数乘积模型、有关删节数据 
的模型、纵贯数据的分析模型，包括追踪研究和事件史的分 
析方法。这些模型在社会科学研究中有着更加广泛的 
应用。 

修读过这些课程的香港科技大学的研究生，一直鼓励 
和支持我将两门课的讲稿结集出版，并帮助我将原来的英 
文课程讲稿译成了中文。但是，由于种种原因，这两本书拖 
了四年多还没有完成。世界著名的出版社 SAGE 的“定量 
社会科学研究”丛书闻名遐迩，每本书都写得通俗易懂。中 
山大学马骏教授向格致出版社何元龙社长推荐了这套书， 
当格致出版社向我提出从这套丛书中精选一批翻译，以飨 
中文读者时，我非常支持这个想法，因为这从某种程度上弥 
补了我的教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事。不但要有对中英文两种 
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语言的精准把握能力，还要有对实质内容有较深的理解能 
力，而这套丛书涵盖的又恰恰是社会科学中技术性非常强 
的内容，只有语言能力是远远不能胜任的。在短短的一年 
时间里，我们组织了来自中国内地及港台地区的二十几位 
研究生参与了这项工程，他们目前大部分是香港科技大学 
的硕士和博士研究生，受过严格的社会科学统计方法的训 
练，也有来自美国等地对定量研究感兴趣的博士研究生。 
他 们是： 

香港科技大学社会科学部博士研究生蒋勤、李駿、盛智 
明、叶华、张卓妮、郑冰岛，硕士研究生贺光婢、李兰、林毓玲、 
肖东亮、辛济云、於嘉、余珊珊，应用社会经济研究中心研究 
员李 俊秀; 香港大学教育学院博士研究生洪 岩璧; 北京大学 
社会学系博士研究生李丁、赵 亮员； 中国人民大学人口学系 
讲师巫 锡炜； 中国台湾“中央”研究院社会学所助理研究员林 
宗弘; 南京师范大学心理学系副教授 陈陈; 美国北卡罗来纳 
大学教堂山分校社会学系博士候选人姜 念涛; 美国加州大学 
洛杉矶分校社会学系博士研究生宋曦。 

关于每一位译者的学术背景，书中相关部分都有简单 
的介绍。尽管每本书因本身内容和译者的行文风格有所差 
异，校对也未免挂一漏万，术语的标准译法方面还有很大的 
改进空间，但所有的参与者都做了最大的努力，在繁忙的学 
习和研究之余，在不到一年的时间内，完成了三十五本书、 
超过百万字的翻译任务。李骏、叶华、张卓妮、贺光烨、宋 
曦、於嘉、郑冰岛和林宗弘除了承担自己的翻译任务之外， 
还在初稿校对方面付出了大量的劳动。香港科技大学霍英 
东南沙研究院的工作人员曾东林，协助我通读了全稿，在此 



我也致以诚挚的谢意。有些作者，如香港科技大学黄善国 
教授、美国约翰 • 霍普金斯大学郝令昕教授，也参与了审校 
工作。 

我们希望本丛书的出版，能为建设国内社会科学定量研 
究的扎实学风作出一点贡献。 


吴晓刚 

于香港九龙清水湾 



社会网络分析从一开始就是一种跨学科的研究方法。 
与其他源于单一学科的研究方法如多维度测量法不同，网络 
分析的起源至少能追溯到三种学 科:心 理学、人类学和社会 
学。在心理学领域，《社会计量法》 ( Seciometry ) 杂志 （ 1937 ) 
的创始人、心理医生雅各布 • 莫雷诺 (Jacob Moreno ) 提出了 
同名法。同名法是用来测量社会关系的，以便更好地研究社 
会结构和心理健康的关系。人类学家 W . 劳埃德 • 沃纳 
( W . Lloyd Warner ) 和心理学家埃尔顿 • 梅奥 (Elton Mayo ) 

主持研究芝加哥西部电力公司的霍桑电厂时，罗斯里斯伯格 
( Roethlisberger ) 和迪克森 ( Dickson ) 利用这项研究于1939年 

发表了有关触排布线室的数据，即使到今天，这种分析仍然 
不失为一项非常出色的研究。对于这套数据，乔治•霍曼 
(George Homans , 1950)、罗纳德 • 布雷格 （Ronald Breiger ) 

和他的同事 (1975) 利用社会学方法重新进行了分析，以使更 
多人有机会了解这套数据。包括哈里森 • 怀特 （Harrison 
White) 和马克 • 格兰诺维特 (Mar Granovetter) 在内的社会 
学家于20世纪六七十年代对推动理解社会网络、完善社会 
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网络分析方法，亦作出了重要的贡献。 

本书第一版于1982年出版，当时书名为《网络分 析》， 
作者为网络分析文献专家戴维 • 诺克 (David Knoke ) 和詹姆 
斯 • 库克林斯基 (James Kuklinski )。 从那时起，社会网络分 
析大步向前发展，影响了社会科学的很多领域。林顿 • 费里 
曼 (Linton Freeman ) 于1979年创办了《社会网络:一本结构 
分析的国际杂志》，成为该领域的旗舰杂志。许多国内或国 
际的社会调査都按常规把社会网络分析内容当做调查的一 
部分，甚至多次重复调查这些问题。例如，美国1985年的 
绿食社会调查 ( QS 辨收集 昀网辚调查 数辑铖广後用于各种 
棘舍 科學鬼軟中 V :妹料年到 (2€ Q 2 年，聋 国雠 的3次舍 
_青少竽 健康紙 肉调查鄱收集了社会网锋方面的数据。在 
新带 年單 I 欧洲的研究者首次做了軟_生辑 质量的 调查，其 
热容® 括家 庭〈工作和生潘爾络等。;近年来，有关社会网繙 
分新的甘算机软件如雨后奉第般涌现 > 而且都可以在网上 
兔费获得4 ㈣ :会 网缭研齊人员现在至决痛力0多种釋序哥 
以选用，例如用，社会网络分析、社 会计量和廉列 分析的 
細和 :以及嫌姆、 • 斯訄德用于分祈矩阵 

爾对饉去二十多年.的这些发辗1，本书的第疗版显然 e 羟 
过財，亟 灘更新猜龌/ 戴雒9诺麂及侖著者杨松 ( Song 
Yang ) 担起此任屬看 f 本书，规命名为《社会网_分柝》 V 。和 
第:并版粮同:，第 芑版鬼 是介绍些基本概念和数据收集何 
疆，然后开始介绍两络分柝®方法和模型。然 而， JBP 使在基 
本概念 迹部分 ，新版本也添加了彻多重要内容，如讨论网络 
分析的三个 S 要的潜在假设 K 而且，:这本书还反 1 映了社会网 



络分析的许多最新进展，例如，更多地强调图形及 P * 模型这 
样的高级方法。网络研究人员及学生将会发现，本书为他们 
探究社会网络数据提供了许多极好的指导。 


廖福挺 
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近几十年来，社会网络越来越受到公众和学界的青睐。 
约翰•桂尔 (John Guare ) 的电影作品《六度分隔 》 （Six 
Degree of S 印 araifon ) 使得社会心理学家斯坦利 • 米尔格雷 
姆 (Stanley Milgrom ) 的小世界理论众所周知。小世界理论 
指的是，任何两个人都可以通过几个紧密连接的中介产生关 
联。该理论的另一种流行文化表现形式是“凯文 • 培根游 
戏”，即影迷只需小小的努力，就可以通过演员的搭档及搭档 
的搭档让两个成名演员通过几个搭档联系起来。现在，在 
高中生和大学生中， MySpace 和 Facebook 等在线网络交流 
如雨后春笋般 涌现; 与此同时，商务部门也不断建议利用网 
络来寻求新的商业利润和职业发展机遇 ( Cross，Liedtka h 
Weiss , 2005)。 

如图 1. 1 所示，在过去 30 年里，关键词为“社会网络”的 
社会科学出版物成指数增长，且毫无变缓的趋势。类似地， 
网络研究也迅速被应用到自然现象及数学和物理领域中复 
杂的社会系统中 （ Barabdsi ， 2002； Newman , 2003； Watts , 

2003)。网络分析已然成为一种制度化的跨学科的视角，它 
的基本概念和测量方法已为多个领域的研究人员所熟知，如 
社会学、人类学、经济学、组织研究、工商管理、公共卫生、信 
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息科学、生物学、复杂理论和混沌理论。 



--- 表示题目中含“社会”和“网络”的文章数 
—表示摘要中含“社会网络”的文章数 


图 1. 1社会科学文献中有关“社会网络”研究文章的增长情况 


同时，可用于网络分析的计算机软件也相应地快速增 
长，如 UCINET 、 Pajek 、 NetMiner 、 STRUCTURE 、 Multi - 

Net 和 StOCNET 等通用程序被广泛应用于常规的网络数据 
分析(详细介绍请参见 Huisman van Duijn , 2005)。同时， 
也出现了许多有特殊用途的程序来处理识别亚群体 ( Frank ， 
2003)、研究隐性人群 （Frank Snijders , 1994)、统计检验 
( Tsuji , 1997) 和计算賦值图中的最优连接 （Yang & Hex - 
moor , 2004) 等特殊问题。 UCINET 可能是最受欢迎、使用 
范围最广的软件包，版本不断更新，为许多网络分析方法的 
实现提供了综合的解决方案。它还提供了各种文件输入和 
输出、数据操作、网络工具 ( MDS ， 聚类和统计分析)和网络方 
法(位置、角色、亚群体、块模型和自我中心分析法)等级联模 
块。基于上述理由，本书将使用 UCINET 软件来分析不同的 
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网络实例、阐释有关的网络分析。 

本书是1982年诺克和库克林斯基合著的《网络分析》 
(第一版)的全面修订版。除了综述有关基本方法的论题外， 
我们还囊括了过去1/4个世纪的研究新进展。但是，由于篇 
幅限制，本书不可能像沃瑟曼和浮士德 （Wasserman 
Faust , 1994 ) 那样进行全面介绍，但与德热纳和福斯 
(Degenne & Forse , 1999) 、斯科特 ( Scott ，2000) 的入门书籍 

相比，本书介绍了更多的高级方法。本书为进一步学习卡林 
顿、斯科特和沃瑟曼 （ Carrington, Scott &- Wasserman, 

2005) 介绍的更深入的高级方法打下了一定的基础。 

本书主要应用于教学，针对的读者主要是社会科学领域 
的研究生和专业人士，其中包括社会学、工商管理、人类学、 
经济学、公共卫生和人力资源等。这本书可作为研究生课程 
的教学参考书，可用于专业学会或暑期研修班的研讨会，当 
然也可用于网络研究的自学。大学高年级学生和研究生如 
果对社会网络分析感兴趣，也可通过阅读本书在社会网络分 
析技巧和学术志向方面获得更高的起点。很多专业人员在 
做社会网络研究时会面临许多挑战，例如如何设计一个社会 
网络项目，网络数据收集过程中可能出现的各种细节和问 
题，以及分析社会网络数据时其他可以替代的技术等。社会 
网络学者可以把本书作为一本简单实用的复习用书或参 
考书。 

在本书中，我们采用实际的社会网络研究问题来解释相 
关的概念和方法，引用的例子包括孩童游戏小组、组织、社区 
和跨国集团等。我们尽量避免使用复杂的专业术语，而是用 
简洁的语言来进行精确介绍。本书共包括四个部分。第2 
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章介绍有关关系数据和网络的概念，这些概念可应用于一系 
列的观察单元、分析层次和测量类型。这一章比较了关系的 
内涵和构成，区分了自我中心网络和全幅网络。结构方法强 
调网络分析揭示经验交流背后更深层模式的价值。第3章 
主要关注数据收集问 题:边 界界定、全幅网络和网络抽样、提 
名法和提名清单、偏差和可靠性、自我中心网络和全幅网络 
的关系测量，以及缺失数据。第4章讨论网络分析的基本方 
法，包括图表法和矩阵法;中心度、声望和权力;小团体、内聚 
和连接;结构 等价; 视觉演示、聚类和多维 标度; 块模型。第5 
章介绍了一些更髙级的网络分析方法，包括位置和 角色； 自 
形等价、同构等价和正规 等价; logit 模型 ( p * ); 隶属网络和 
点阵分析。读者如果希望通过分析书中的数据，以便学习如 
何开始进行网络分析，可以在本书作者诺克的主页 http ：// 
www . soc . umn . edu / 〜 knoke / 上找到书中所有实例的数据集 
和相应的计算机指令的链接，并且可以下载文件压缩包。 
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本章讨论社会网络分析方法的基本概念。我们使用学 
者普遍使用的术语和定义，但在存有分歧的情况下，遵从社 
会学惯例。我们在解释这些基本概念的同时，说明这些概念 
的文献出处。感兴趣的读者可以通过这些文献，更好地理解 
网络分析方法是如何应用到实际问题的研究之中的。 

为了更好地理解我们所展示的社会网络分析视角的独 
特性，这里将基于变量的个体分析方法与之进行一下比较。 
社会科学的许多领域，甚至社会科学的绝大部分领域，都假 
定行为人作出决定和采取行动时，不考虑其他行为人的行 
为。无论是基于效用最大化的理性计算来分析，还是基于因 
果关系的动因推理来分析，这些解释仅仅主要考虑了个人特 
性，而忽略了社会行为人所嵌入的更广泛的互动背景。与此 
不同的是，网络分析法明确假定，行为人参与到社会系统之 
中，而这个系统将他们与其他行为人联系在 一起; 行为人之 
间的关系对各自的行为存在着重要影响。网络分析理论和 
方法的关键，是识别、测量和检验关于行为人之间关系的结 
构形式和实质内涵的假设。这种对结构一关系研究的独特 
重心，将社会网络分析法与迄今依然主宰大部分社会科学的 
以变量为中心的个体分析的传统区分开来。 
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第 1 节 I 基本假定 


网络分析的视角强调把结构关系作为关键的导向原则， 
其中社会结构的组成是“有形实体之间关系模式的规律性， 
而不是抽象的规范和价值之间的协调，也不是对这些有形实 
体的特征进行的分类” ( White，Boorman &- Breiger , 1976： 
733— 734) 。实体可以是单个的自然人、小的群体、组织甚至 
是国家。通常连接这一系列实体的关系模式包括宏观的社 
会背景或者整体的结构，这些背景和结构影响它们的认知、 
信念、决定和行动。网络分析的首要目标是精确测量和展现 
这些结构关系，并解释他们发生的原因及产生的结果。 

社会网络分析的重要性依赖有关关系模式及其效用的 
三个基本假设。首先，对于理解所观察的行为，结构性关系 
要比年龄、性别、价值和意识形态等个体特征更为重要。例 
如，在解释 15 世纪的佛罗伦萨哪些精英家族支持美第奇 
(Medici) 或寡头政治集团的统治时，更多地依赖这些统治精 
英之间的经济、赞助和婚姻关系，而较少依赖他们的阶级和 
社会地位等个人特征 (Padgett Ansell , 1993 )。 在实体参 
与的不同社会情境中，他们的许多特征保持不变(如不论在 
家、在工作场所还是在教堂，一个人的性别、种族和教育程度 
都是不变的)。但是，具体的结构关系仅存于特定的 时空； 当 
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情境发生变化时，这种特定的结构关系将消失或暂时中止 
(例如，学校之外就不存在老师和学生之间的 关系； 当一个人 
丧偶或离婚时，婚姻关系将不存在)。一个在办公室做勤杂 
工的女性，在工作场所可能不需要什么主动性，但她却可能 
是邻居关系协会中强有力的领导者，或者是个敢作敢为的 
PTA ® 成员。这种行为差异很难用性别、年龄和社会地位等 
不变的特征来 解释; 但是，当意识到人与人之间的结构关系 
可以随着社会情境的改变而变化时，这种差异就很好理解 
了。这种结构关系的分析方法备受网络分析者的 欢迎; 而与 
之形成鲜明对比的是诸多的互争高低的实体论方法，这些方 
法将静态的“事物一概念”作为自己的主要分析单元，包括本 
质、自我行为、基于规范的一致、理性选择、以变量为中心和 
社会认同途径，等等 ( Emirbayer ，1997). 网络分析认为，除 
了个体特征，社会实体间的已具有模式的关系也影响社会实 
体。根据这样的推测，网络分析宣称，可以为分析社会行为 
的原因提供更加全面的理论和实证解释。 

第二，社会网络通过实体之间的关系所建立的各种结构 
机制影响实体的观念、信仰和行动。直接关系和更密集的互 
动关系使得实体获得更好的信息、更多的认知、更强的敏感 
性，以影响他人或受他人的影响。间接关系通过媒介(例如 
常见的经纪人，他们为客户牵线)也会激发新想法，或获得一 
些潜在的有用资源，而这些资源可能需要通过与他人交易才 
能获得。例如，相对于较弱、较疏远的社会关系，求职人员一 
般很难通过更密切的社会关系获得有价值的信息，因为关系 


①即家长一教师关系协会。——译者注 
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更亲近的人已经共享或传播了相同的信息（ Granovetter, 
1973)。关系结构提供了各种复杂路径以协助或阻止人群中 
知识、流言蜚语的传播。社会结构配置上的不同，解释了芬兰 
有机耕作的普及 (Nyblom，Borgatti, Roslakka Salo，2003) 
和美国城市中性传染疾病的传播 （Jolly，Muth, Wylie & 
Potteral, 2001)。 个人的身心健康相当大程度上依赖社会支 
持网络——比如，当你沮丧的时候，是否有人给你送上一份 
心灵鸡汤 (Cohen et al. ，1998)。结构关系对维持团体的凝 
聚力和团结至关重要，但也可能强化对外部群体的偏见和冲 
突。竞争与合作关系有效实现了跨国公司内部有计划的组 
织变迁 (Tenkasi & Chesmore , 2003) 、社会运动中集体行动 
的动员 （Diani & Me Adam, 2003) ，以及从事贩毒、非法移民、 
走私和恐怖活动等“黑色网络”的运转 （Raab & Milward, 
2003)。通过把信息和资源传递到特定的结构位置，网络有 
助于激发兴趣、分享认同、促进共同的价值和规范。网络分 
析者试图揭示社会关系如何影响社会实体的理论机制，并发 
掘出特定机制在具体情境中运行可能需要的条件。 

网络分析的第三个潜在假设是应将结构关系视为动态过 
程。这个假设认识到网络不是静态结构，而是通过个人、群体 
或组织等实体内部的互动不断改变的。当这些实体利用有关 
网络的知识获取优势时，他们或有意或无意地改变了他们所 
处的关系结构。例如，在柯尼斯和诺克 （Kenis Knoke， 
2002) 有关组织领域网络变迁的理论中，就认为先前的沟通 
结构会影响后续的战略联盟抉择。相应地，这些组织间的关 
系改变了信息的流动，从而为将来的联盟提供了更多的机会 
或约束。这些动态过程验证了社会行动理论中更为普遍的 
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“从微观到宏观的问题” ( Coleman ， 1986)。关键问题是大规模 
的系统性变化如何从个人的综合偏好和目的性行动中显露出 
来。由于网络分析同时涵盖实体和结构，因此它为微观层面 
选择的变化和宏观层面结构的变迁之间的连接提供了有效的 
分析概念和方法。不幸的是，跨层动态过程的实证网络分析 
仍只是一个理想的目标，并没有成为一个普遍的做法 ( Emir - 
bayer , 1997： 305) 0 但是，随着纵向网络数据的逐渐增多，对网 
络变迁进行抽象和调査的新方法也将出现 (Faust Skvoretz , 
2002； Snijders , Steglich , Schweinberger &• Huisman , 2007) 0 
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第2节 I 行为人和关系 




任何社会网络中两个不可或缺的元素是行为人和关 
系。它们的结合共同构成了我们下节要介绍的社会网络。 
行为人可以是自然人等个体，或非正式群体、正式组织等 
集体。个体行为人的例子包括操场上的小孩，参加舞会的 
高中生，公司里工作团队的职员，疗养院的员工和住客，秘 
密基层组织中行动的恐怖分子，等等。集体行为人可能是 
在一个行业中竞争的公司，筹集慈善基金的志愿者组织， 
在国会里拥有席位的政党，也可能是签署军事同盟协议的 
国家。有时网络行为人也包括一些混合类型，如一个组织 
领域包含有供货商、生产商、顾客和公共卫生的政府监管 
人员。 

关系一般被定义为两个行为人或对点之间的特定接触、 
连接或联结。关系可以是定向的，即第一个行为人发起，第 
二个行为人接受(如劝 告）； 关系也可以是非定向的，即存在 
互动(如交谈)。关系不是一个行为人的特征，而是在只有两 
个行为人保持联系时一种共同的对偶特征。在个体行为人 
以及集体行为人之间，会发生许多各种不同的关系，这些关 
系可展示网络结构，并解释它们的效应。比如，在个人之间 
交往的层面上，小孩之间交朋友 、一 起玩耍、打架、相互信任， 
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同事之间一起工作、讨论、提意见、信任、背后说坏话和背叛。 
而在集体行为人之间，公司进行商品和服务的交易、相互交 
流、竞争、起诉、游说和合作。一个网络研究者应该测量哪一 
种关系，这取决于研究项目的特定目标。例如，社区网络研 
究可能调查各种不同的邻里活动，而银行网络研究则主要调 
查财务交易。当然，一些分析详细研究多类关系，如公司董 
事会董事之间的政治、社会、经济联系。下节我们将介绍关 
系内涵的一般分类。 

很多社会研究无论是通过调查还是实验来收集数据，依 
旧依赖测量和分析行为人的特征，并把行为人的特征作为分 
析单元。虽然特征和关系是研究社会行为的不同概念方法， 
但是它们不能视为互斥的选择。相反，许多行为人的特征可 
以重新概念化为两个行为人之间的关系。因此，虽然一国每 
年的进出口额是这个国家经济的特征，但所有的任何两个国 
家间交易的商品和服务量却可以表示全球经济的交易网络 
结构。一个棒球队的总输赢纪录显示这个球队的表现，但每 
两个队的输赢比例可能揭示一个联盟权利结构的细微差别。 
朋友的数量显示了一个小孩的受欢迎程度(人气），但分析每 
一对朋友关系的选择就能揭示岀重要的小团体和群体。关 
系反映出复杂社会系统中仅靠成员特征的求和或均值所不 
能描述的新维度。结构关系能影响个人行为和系统表现，且 
这些行为和表现不能还原为行为人的特征。例如，与其考虑 
行为人的教育、年龄、社会阶层、性别和种族，不如考虑行为人 
之间的交流和建议关系结构，这样能更好地解释技术创新的 
传播比例和模式 (Cowan & Jonard ， 2004； Valente ， 1995)。类 

似地，和推测群体的易受感染性和抵抗力特征相比，熟知群 
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体间的亲密关系结构更有利于防止像禽流感和艾滋病等传 
染性疾病的流行爆发 (Jolly etal . ， 2001) 0 在此，一个非常重 
要的推论是 :仅仅 分析行为人的特征，会忽略社会行为的网 
络视角所提供的许多重要解释。 
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第3节 | 网络 
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社会网络是由一群行为人组成的结构，在这个结构中， 
行为人通过一系列关系相连。社会网络的绝大多数定义都 
包括这两个基本组成部分。例如，“社会结构可以表述为网 
络——包括一系列节点（或社会系统的成员）和一系列描述 
它们之间关联性的关系 ” (Wellman & Berkowitz , 1988:4)。 

即使行为人都相同，不同类型的关系也可以形成不同网络。 
因此，一群雇员之间的朋友网络很可能与他们之间的建议寻 
求网络存在很大差异。网络行为人之间存在联系并不意味 
着所有行为人必须和其他行为人之间存在直接关系。实际 
上，有时直接的对偶关系并不多见。相反，网络分析会同时 
考虑目前存在的或不存在的关系，也可能会把关系的强度变 
化考虑进去。有形实体之间的实际关系构造，便确定了一个 
特定的网络结构——该网络的模式或形式。网络结构的形 
式变化多端，既有所有行为人之间没有关联的孤立结构，也 
有所有行为人之间直接相关的饱和结构。一般来说，实际的 
网络结构处于独立网络结构和饱和网络结构之间，其中一些 
行为人比其他行为人拥有更广的网络。网络分析中的一个 
核心理论问题，便是解释不同结构的发生情况，以及在行为 
人层面来说明其与其他行为人之间关系的变化。在网络研 
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究中，一个同样重要的实际任务是利用关系数据，发掘并精 
确展现这些结构。 

约翰 • A « 巴恩斯 (John A * Barnes , 1954) 被认为是第一 
个使用“社会网络”这一术语的学者。他是一个人类学家，曾 
经研究挪威一个岛上居民之间的关系。巴恩斯将社会互动 
视为“点的集合，其中一些点由线连接”，从而形成关系的“全 
部网络” ( Barnes ， 1954:43)。人际关系的非正式形式构成社 
会网络整体的一个部分。巴恩斯利用了雅各布•莫雷诺 
(1934) 的成果，后者在展示小孩对同班同学的爱憎关系研究 
中，率先使用了线和标示点的手绘社会关系图。本书将在第 
3章讨论如何表示有关社会网络关系的形象图示和数学矩 
阵。半个多世纪以来，社会网络这一理念和方法已经从人类 
学和社会学延伸到诸多学科，并被运用到诸多主流的理论和 
问题研究中。关于社会网络原理缘起及普及的历史性综述， 
可参见费里曼(2004)，斯科特 (2000) 及诺克斯、萨维奇和哈 
维 ( Knox，Savage &• Harvey , 2006) 的著作。 

假如社会网络分析仅仅只是描述一群行为人是如何联 
系的一个概念性框架，那么它就不会激起社会研究者如此大 
的兴趣和努力。作为一套综合的理论概念和分析方法，社会 
网络分析所能提供的不仅仅是精确重述。由于社会网络结 
构影响到个体层次分析和系统层次分析，因此它被认为可以 
用来解释结构关系中的变化及其结果。 J . 克莱德_米切尔 
( J . Clyde Mitchell , 1969:2)关于社会网络的定义，就特别强 

调了它们对结果的影响。他的定义如下 :社会 网络是“在特 
定人群中的一整套具体的 联系； 这种联系有一个额外特征， 
即这些联系作为一个整体可以用来解释其中人们的社会行 
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为”。这一论述在本书的第一版中也得到了回应 :“行 为人之 
间的关系结构和个体行为人在网络中的定位，对于每个个体 
单元和整个系统来说，在行为、意识和态度方面都有重要的 
影响 。” (Knoke Kukliriksi , 1982: 13) 同样，巴里 _ 威尔曼 
(Barry Wellman , 1999: 94) 也写道 :“在 描述社会结构的基本 
模式，在解释这些模式对人们行为和态度的影响上，社会网 
络分析都能起到作用。” 
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第4节 | 研究设计的基本要素 


对于研究者来说，构成测量和分析框架的社会网络研究 
设计的三个基本要素 是:抽 样单位、关系的形式和内容、数据 
分析层次。每一个网络研究项目都必须在开始田野工作之 
前对每个基本要素作出明确界定。这些设计因素的不同组 
合将生成各种不同的社会网络调查，这将都呈现在多个学科 
的研究文献中。 


抽祥单位 


一项社会网络研究设计的第一步，即选择一个最相关的 
社会背景，并确定在此背景下的哪些组织涵盖了这些社会网 
络行为人。根据规模和复杂性大致的升序排列，构成抽样单 
位的六个基本单元，包括个体、群体(正式和非正式)、复杂的 
正式组织、阶级与阶层、社区，以及民族一国家。一些两阶段 
的研究设计包括一个高层次系统，在此系统中行为人构成其 
中的低层次实体。这种嵌套社会背景的普通例子包括公司 
与职员、学校与学生、市政机构与公务员、大学及其院系与教 
授等。 


最早且至今仍然流行的社会网络研究项目一般选择小 
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规模的社会背景——如课堂、办公室、工厂、帮会、社交俱乐 
部、学校、村庄、人为组织的试验群体等，在此将其中的个体 
成员作为社会关系的行为人，而他们的关系正好构成了受调 
查的网络。最新的例子有 :加州 少年课堂中与欺负和被欺负 
相关的朋友关系模式 （ Mouttapa，Valente Gallaher , 
2004) ，两家冶金工厂全方位质量管理方案的实现 ( Harrison ， 
Laplante & St - Cyr , 2001) ,以及马达加斯加一个村落中家庭生 
育控制方式的社区分布情况 (Stoebenau & Valente ， 2003)。在 
精确描述成员资格、全面观察群体、易于通过上层权威打通关 
系等方面，小规模背景都有明显优势。较大规模的环境往往 
都有互相渗透的或者模糊不清的边界，但是社会网络分析法 
并不因其内在特性而不适宜将其概念与方法运用于这类环 
境。最近的研究范 例有: 某一中西部城市青少年的恋爱与性 
行为关系网络 ( Bearman，Moody &- Stovel , 2004)，学院派经济 
学家的合著关系 ( Fafchamps，van der Leij & Goyal , 2006)。 

关系的形式和内容 

除了选择一个恰当的抽样单元之外，社会网络研究者还 
必须决定收集哪种具体社会关系的数据。行为人之间的关 
系既有形式又有内容，这种两分法概念是由格奥尔格 • 齐美 
尔 (Georg Simmel ，1908) 在分析社会交往时提岀的。形式和 
内容这二者在实践中是不可分的，只是为了分析的方便而将 
二者区分开来。内容是指社会交往中人们的兴趣、目的、压 
力或者动力，而形式则是由此而将具体内容转化为社会现实 
的互动模式。齐美尔认为，社会学的任务就是发掘确认社会 
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交往有限的几种形式 :交际 、超越、臣服、竞争、冲突、合作、统 
一等。这些交往形式是在广泛的具体环境、社会制度和历史 
背景下发生的。同一种具体形式在内容上可以千差万别。 
例如，上级和下级这一基本关系形式，可以在政府、军队、商 
业、宗教、体育运动和文化机构等不同组织中展现。相反，不 
同的内容——比如追逐经济利益和政治权力——也可以通 
过竞争与合作的形式展现。 

内容与形式这一二分法概念也运用到社会网络分析中。 
关系形式是行为人关系的一个特征，它独立存在于所有的具 
体内容之中。有两种基本的关系 形式： （1) 双方行为人之间 
互动关系的强度、频率或者力度； （2) 每对成员之间关系的指 
向，即是否为0,或者非对称的，或者双向的选择。关系内容 
指作为关系发生原因的那些事物 （ Burt ， 1983:36)。这种实 
质性内容是由研究者建立的一种可分析构造，意在从行为人 
主体视角获取某一关系的意义。当人们在某一社会背景中 
被问及“你的亲密朋友、一般朋友和认识的人”时，这一问题 
的内容就是指“友情”。这一询问的结果需要依每一行为人 
是如何定义这三个词所代表范畴的意思而定，另外还得依行 
为人是如何根据不同人际互动的以往经验来区别对方而定。 
很明显，人们在对友情这一标签及表示亲密或疏远的行为的 
理解上，可能会有很大差别。 

关系内容或者说连接模式的选择，大部分是由项目的理 
论焦点和研究目标来决定的。因此，一项关于保健关系网络 
的研究就会调查人们有关健康事项信息和建议的来源，而一 
项关于政治关系网络的研究也许会让他们列出平时经常和 
他们一起讨论或参与政治事务的人。在一些实证问题的研 
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究中，也许不仅仅某一个独特的可分析关系内容需要调査， 
而且其他两三种甚至更多的连接模式（即复杂关系网络）同 
时也可能需要进行测量和分析。一项关于德国、日本与美国 
政府劳工政策游说机构的比较研究，要求受访人报告他们的 
独立政策信息、政治支持、与他人的信息互换关系等 ( Knoke ， 
Pappi ， Broadbent Tsujinaka ， 1996)。 我们将在第 4 章中 

利用其中的一些数据来阐述有关网络分析的方法。 

在齐美尔看来，对于将关系内容的细微差别进行概念化 
和操作化，虽然研究者们几乎有着无限的想象力，但是在这 
里我们还是提供一个小小的基本内容范式，具体内容如下。 

(1) 交换关系 :行为 人互换有关实物或象征性物质的控 
制，比如赠送礼物或者买卖商品。 

(2) 沟通 关系: 通过行为人之间的联络渠道，双方交换有 
关信息。 

(3) 交叉关系 :行为 人在两个或多个社会组织中有成员 
资格，例如公司董事会成员同时拥有其他身份。 

(4) 利用 关系: 行为人之间互相联系，是为了获得有价值 
的物品、服务或者信息，比如一份工作、一个政策建议或者一 
个加入某项社会行动的机会。 

(5) 情感关系 :也许 最常接受调查的社会网络关系就是 
行为人对他人的感动、崇拜、尊敬、厌恶或者敌视等情绪的 
表达。 

(6) 权力 关系: 这类联系通常发生在正式的科层组织中， 
表明行为人对于发布和遵守命令的权利和义务。 

(7) 亲属关系 :这类 血缘和婚姻的联系反映家庭角色内 
的关系。 
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社会网络分析对于各种各样的关系内容是如何连接的 
仍然认识不足，因为对于关系内容领域结构的考察仍然研究 
得不够。罗纳德•伯特 (Ronald Burt ，1983) 在关于调査对象 
是如何认识关系内容的研究中，发现在抽样调査北加州人的 
33个问题中，存在实质性的混淆、重复和可替代等情况。他 
认为，仅仅只需五个关键问题就足以涵盖有关友情、相识、工 
作、亲属和亲密关系这几种关系内容的主要结构。然而，对 
于在各种不同网络环境中普遍使用的关系术语和标签，人们 
所赋予其意义的相似性和差异性，我们还需要更多的研究。 
一张关于关系内容领域间的结构性连接的认知图，可以帮助 
研究者准确有效地选择最适合理论和实践关注点的具体关 
系内容。 

数据分析层次 

在选择了抽样单元、关系的形式和内容之后，研究者对 
于他们在社会网络研究项目中所搜集到的数据，在哪一个层 
次上进行结构分析，有多个可替代性选择。本书第3章和第 
4 章会详细论述有关合适的测量和分析方法。这里我们将首 
先概述四种概念独立的分析层次，调查者可能会从中选择决 
定集中分析。 

最简单层次是自我中心网络。这一社会网络由一个行 
为主体和其他行为客体组成，其中行为主体与其他行为客体 
发生直接联系，而其他行为客体之间也存在直接联系。这一 
层面也被称为行为主体的“第一关系 圈”; 相对于第一圈，所 
有行为客体的客体构成了第二关系圈和更高层次的关系圈， 
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以此类推。假如一个网络中有 iv 个行为人，那么自我中心网 
络则会有 N 个分析单元。相应地，每一主体行为人可以通过 
其与其他行为客体联系的数量、强度和其他特征加以描述， 
例如报酬与付出关系的比例，或者行为客体之间联系的密 
度。最近一项关于毒品成瘾者个人健康风险的自我中心网 
络研究发现，波多黎各的瘾君子在与陌生人或认识的人发生 
性行为中，要比纽约的瘾君子更容易感染艾滋病病毒 ( Kang , 
Deren , Andia , Colon & Robles , 2005)。 在某些方面，自我 

中心的分析层次类似于典型的基于属性调查研究，即在受调 
查者通常的个体特征——例如性别、年龄和教育背景等属性 
之外，再补充一些可从其直接网络关系中获得的测量值。自 
我中心网络研究设计比较适合调查那些不太愿意与他人接 
触的对象。1985年美国成年人口社会综合调查 ( Marsden ， 
1987) 率先识别和收集有关受调查对象的客体的信息，我们 
将在第3章详细论述。 

第二个分析层次是由成对的行为人构成的对偶网络。 
假如双方组合顺序无关,就像在婚姻状况中两个人要么是未 
婚、同居、已婚，要么是分居、离婚等，那么由 iV 个行为人组成 
的样本则有 （ N 2 — iV )/2 种分析对偶组合。但是，如果组合 
关系的指向有意义，比如下达命令或者征求意见，那么这一 
样本包含 0 V 2 — N ) 种有序对偶组合。对偶网络最基本的问 
题是: 两行为人之间是否存在具体联系？如果是，那么这种 
联系的深度、强度和持续时间又是多少？与此密切相关的一 
个问 题是: 没有直接联系的双方是否仍然经由中间渠道（比 
如经纪人、中间人)间接联系？ 一般的网络分析都试图将对 
偶关系的各种变化解释成二元特性的一个函数，比如羽禽群 
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居的同质假设，或者是异性相吸的互补假设。与一般看法相 
反的是 ，一 项关于1951年至1985年间国际关系冲突的研究 
发现，具有紧密军事与经济联系的两国和缺乏如此紧密关系 
的两国相比较，在陷入争端的可能性上前者也只是比后者稍 
微少那么一点点 ( Benson ，2004) 0 

第三个网络分析层次当然就是三元关系了。 N 个行为 
( N ) 

人有 种组合，这是从 N 个行为人中每次取3个得到的组 

[3 J 

合数。在3人一组的行为人中，显性和隐性可选择关系的所 
有可能组合将产生一系列16种独特的三元组类型。在实证 
网络分析中 ，一 个基本的描述性问题就是在16种类型中观 
察到的三元组的分布情况，这种综合分布量表也被称为三元 
关系统计表。三元关系结构的实证研究一般关注情感性连 
接点（比如喜好、友谊、敌视)，并且特别关注三元关系的平衡 
和传递(例如，假如 A 选择 B ， B 选择了 C ， 那么 A 是否也会 
倾向于选择 C 呢)。因为本书没有足够篇幅来评述三元网络 
分析方法，有兴趣的读者可以关注詹姆斯 • 戴维斯、保罗 • 
霍兰和塞缪尔 • 雷恩哈特 (James Davis , Paul Holland &• 
Samuel Leinhardt , 1979) 的研究项目，以及沃瑟曼和浮士德 
(1994:556 — 602) 的全面综述，以获得更加详细的资料。 

除了上述三个微观层次的分析之外，全幅网络是最重要 
的宏观分析层面。研究者利用所有 N 个行为人的每一种关 
系的信息，对整个网络的结构关系进行描述和解释。其中， 
研究者特别关注在此网络系统中行为人的特定位置或者社 
会角色的展现，以及在这些位置上和位置间行为人联结的模 
式。虽然一个全幅网络有 N 个行为人和 （ N 2 — N ) 种对偶组 
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合（自我关系一般被忽略)，但是所有这些元素加起来只形成 
单个系统。在全幅网络层面上分析结构变化的原因和结果 
的各种假设，可能需要利用多个不同系统，而且也是相当耗 
费研究成本的。然而，全幅网络分析却广受欢迎，其中一些 
例子包括对爱尔兰都柏林地区青少年朋友关系和伴侣关系 
的研究 ( Kirke ， 1996)、世界各城市间优势等级分层的研究 
(Smith &- Timberlake , 2002) ，以及全球信息产业部门战略 
联盟的研究 ( Knoke ， 待岀版)等。 

网络分析的这四个层面表明，在某一个层次上涌现的现 
象，并不能够由其他层次上关系的现有认识简单地通过逻辑 
推导出来。例如，选择关系的传递在友谊构成的理论上是一 
个非常重要的变量(我朋友的朋友，就是我的朋友），这在三 
元关系层面中可以观察到，但是在自我中心关系和对偶关系 
层面上就不可能观测到。举另外一个例 子:考 察两个科学研 
究团体，他们在科研讨论网络中具有大概相似的自我中心结 
构、对偶结构和三元结构。但是，假如第一个科研团体的全 
幅网络分为几个互不相关的小组，那么其中的许多科学家就 
不可能与其他人接触，甚至间接接触也不可能。假如第二个 
科研团体的整个网络中各小组间有联系纽带和通道，那我们 
就可以想象到，其中的信息沟通更加流畅，科学创新的频率 
更高。网络分析作为一种实证研究的理论指导框架，它涵盖 
各种突发的结构关系，从而能够解决多个分析层次上的问 
题。网络分析这一变化多端的功能使得它迅速流行起来。 
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对于任何网络实证研究，调査者在开始收集数据之前， 
必须首先处理三个重要的事 项:范 围界定、网络抽样、关系测 
量。由于在网络研究项目里，设定行为人的边界是一个不言 
而喻的起点性工作，因此我们就从这点开始讲起。 
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第1节 I 范围界定 


关于网络分析的范围界定问题，可以这样简单地 设问: 
在收集社会关系的数据时，也许这些社会关系实际上并不存 
在一个清晰的界线，那么一个研究者在哪里设定边界呢 
( Barnes , 1979:414)? 罗曼、马斯登和普伦斯基 （ Laumann ， 
Marsden Prensky , 1983: 19) —开始通过对比唯实论与唯 
名论的定义策略来寻求他们的答案。在设定具体网络行为人 
的资格以及确认待分析社会关系的类型上，他们制定具体的 
涵盖规则。但在随后的网络范围界定范式上,他们用三个基 
本方法取代了上述二分法策略 :位置 、关系和事件 ( Laumann ， 
Marsden & Prensky , 1989) 0 本节我们将分析这两种处理 
过程。 

唯实论和唯名论的界定策略 

在唯实论的界定策略中，网络分析者采纳系统行为人自 
身的主观意向，将范围界定在某一实体组织(例如一个家庭， 
一个公司或者一个社会团体)内的所有或者几乎所有的行为 
人都可以自觉体验到的限度内。行为人及他们的关系是包 
含还是排除，得依赖于其他行为人对于相关性的判断。例 
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如，诺克和罗曼 (1982:256) 即釆用这一规则来选择美国能源 
与健康国家政策领域中的核心组 织:“ 一系列重要的行为人 
旨在参与起草、建议或选择有关行动方针（即政策选择），以 
期解决当前明确的重要问题。通过确定他们之间的相互关 
联性或者共同目标的实质性定义标准，便得到了一个作为子 
系统的政策领域。”有些组织在国家能源和健康政策的制定 
上，被圈内人士认为并不具备什么影响力，因此研究者就将 
它们排除在外。 

在唯名论的界定策略中，为某一特定研究项目的分析或 
理论目标服务的一个概念框架，在这里被当做一个先在的理 
念，用于界定某一网络边界。在许多情形下，法定的或者正 
式的成员资格要求已经划出了一条明确的界线，比如某一课 
堂上的小学生、某州律协的律师、在联合国具有普遍协商身 
份的组织。另一个例子是，马克思主义研究者在定义工人阶 
级时，将其界定为具有共同生产关系的所有雇员。当然，在 
何种程度上，主观评价和概念强加这两种界定策略恰好会得 
到相同的边界，这完全是个实践的问题。 


定位策略 


这种策略利用行为人的特征、他们在某一正式组织内的 
成员资格，或者对某一个清晰界定的位置的占有，来对某一 
网络进行边界划定。尤西姆 ( Useem ，1979) 对美国商业精英 
的研究，便是这一定位策略的范例。他将商业精英界定为在 
1969年的797家美国最大公司的董事会里的成员，并从中选 
出了 8623个样本。诺克 (2001) 在分析全球信息产业部门的 
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公司战略联合时，将公司在1989年至1998年间《财富》500 
强、《财富》1000强、全球500强的榜单排名作为遴选标准。 
费尔德曼 • 萨维斯伯格、东科和杨 （ Feldman - Savelsberg ， 
Ndonko &- Yang , 2005) 调查 Bamil 6 k 6 城六个喀麦隆妇女同 
乡会成员的集体记忆选择时，要求这些妇女都来自同一个村 
庄或者部落。研究者利用定位策略可能会发现，某一组织的 
成员名单或者花名册已经过时、不完整，或不准确。他们需 
要自己做普查来编制一个完整的成员名单。 

定位策略一般会得到一个行为人的集合，他们在某一正 
式组织中拥有相似的位置，即使有的人彼此之间并没有直接 
关系。对于使用定位方法揭示的网络结构的代表性，研究者 
应该保持足够的警惕。因此，商业精英间的联系与相对低阶 
位的雇员间的联系是大大不同的。跨国公司间形成的战略 
联盟与小企业之间的合伙也是大不相同的。伴随定位策略 
而生的另一个网络问题是，行为人之间往往并无联系，或者 
构成一些小的紧密团体但彼此间缺乏联系。例如，有些喀麦 
隆妇女，虽属同一同乡会，但是通常彼此间却完全陌生 ( Feld - 
man - Savelsberg , Ndonko &- Yang , 2005) 0 

在采用定位方法进行网络分析时，研究者应当对涵盖或 
排除某一特定定位标准提出明确合理的理由 （Laumann et 
al . , 1983； Scott , 1991:58)。 研究者可以釆用唯名论标准， 
为他们的排除规则设定一个主观性门檻，即使某一定位处于 
持续变化之中。例如，为了研究大公司，研究者也许需要从 
《财富》榜单中抽取50家、100家甚或500家公司。如何设定 
选择范围，更多地取决于时间和研究经费限制，而不是取决 
于人围公司与未人围公司的某些实质性差别。戈拉斯克维 
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奇 ( Galaskiewicz ，1979) 在对一个叫 Towertown 小城的一些 
组织进行筛选时，就生动地说明了上述过程。首先，他采用 
属地原则，即将研究限定在一个地理范围内的人口。其次， 
他根据他的研究时间和经费限度，利用行业标准，排除了商 
业机构、交通业、公用事业、地产业、街道居民组织、社区机构 
以及小学等。 

关系策略 

这一方法依赖于知情者或网络行为人本人提名添加其 
他行为人。关系策略包含几个常用的做法，比如声望法、滚 
雪球抽样法、固定名单选择、扩展性选择以及 K 核心方法。 
我们将在本小节简要地描述一下这些关系策略方法所需的 
条件及其局限性。 

在声望法中，研究者通常咨询有关资深知情人士或者专 
家，请他们提名有关行为人。例如，调査者调査两个精神健 
康治疗机构网络，首先统计当地社区精神健康治疗机构总名 
单 ( Morrissey，Tausig &- Lindsey , 1985)。接着，他们会询问 

调查对象，请他们从总名单中挑出五个他们认为最重要的， 
或者他们最经常联系的机构。通过这两个步骤，便挑选出了 
两例核心的精神健康治疗机构。接下来，请关键知情者即人 
道服务计划委员会和矫正部门的主任们，从总名单中再挑选 
额外的重要机构，对核心名单进行补充。 

声望法非常依赖关键知情人提供准确全面的信息，因此 
研究者在确定重要知情人士上的能力便非常值得关注 
( Scott , 1991:59)。莫里西 （Morrissey et al . ， 1985:35) 就曾 
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经忠告 :“在 评估声望法划分标准的准确性上，并没有一个统 
一的准则。很显然，不同的划分标准会产生不同的行为人涵 
盖范围，也会导致随后的分析受到影响。”对采用声望法获得 
的网络关系名单的可靠性和完整性进行评估，是一件非常困 
难的事情。经常只有等到一个项目完成之后，才可能对此进 
行评价。因此，网络研究者挑选关键知情人，应当有充分的 
理论和实践依据,且这些理由是独立于受调查的具体社会关 
系的 ( Scott ， 1991:59)。但有时抽样偏差问题——即由于非 
随机性的案例缺失而导致样本不能代表目标总体 ( AUison ， 
2001：78-81)——会超越关键知情人士的遴选问题。关键 
知情人士不管如何博学多才，他们所提供的数据，总是与通 
过滚雪球抽样法所得到的数据有系统性差别。 

在滚雪球抽样法中，研究者从小范围的网络行为人开 
始，由他们来提名与其有某种特定关系的其他参与者。同 
样，这些其他参与者也被要求提名其他行为人，直到没有或 
者几乎没有其他人名再被提及 ( Frank ， 2005; Wasserman 
Fraust , 1994:34)。在此方法的早期严格版本中，每一轮滚 
雪球抽样都将产生等量的行为人(例如，列出三个你最好的 
朋友），并且在每个阶段每一个行为人都被问及同样的问题 
( Goodman , 1961)。最近，这两个特殊条件有所松动，允许使 
用不同的问卷，提出数量不等的行为人 （Wasserman & 
Faust , 1994:34)。因为滚雪球抽样法利用网络行为人的社 
会关系来构建样本，所以每一轮都会提出新的行为人，而这 
些新的行为人与现有的行为人存在特定关系。因此，滚雪球 
抽样通常会得到一个关系非常紧密的社会网络 (Laumann et 
al . ，1983)，因而被称为连锁推荐法 （ Heckathom ， 1997)。应 
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答驱动抽样是该方法的一个复杂延伸，它将滚雪球抽样法与 
某一数学模型结合，从而增加抽样的代表性，以弥补非随机 
性选择所带来的偏差 (Salganik Hckathorn , 2004) 0 

在社会网络分析中，滚雪球抽样法对寻找难以接触人群 
具有独特效果，比如毒品交易者、吸毒者、非法移民、 HIV 阳 
性者的性伴侣、地下抵抗组织等。由于缺乏对此类隐蔽人群 
的抽样框，常规抽样调查方法经常得不到足够的样本量。相 
反，滚雪球抽样法可以从访谈一个初始样本开始，比如瘾君 
子经常光顾的治疗机构或者街区。受访者被要求提供与之 
有特别关系的其他行为人的地址信息。接着，调查者联系这 
些被提名者，并且请他们提供与其相关的其他参与者。因为 
网络数据收集工作常常需要知道行为主体介绍的行为客体 
的身份，所以获得其知情同意、保护匿名来源、确保隐私等要 
求就引发了一些伦理问题 （Borgatti Molina ， 2005； Klov - 

dahl ，2005)。 如果研究者直接利用滚雪球抽样法来招募行 
为客体，人权事务委员会也许就不会批准这种抽样设计方 
案。作为替代办法，应答驱动抽样设计会要求种子行为主体 
告知他们的行为客体，如果自愿参与项目可以得到一点小小 
的补偿。 

在实施网络抽样时，一个程序性问题 —— 是否给知情者 
提供一个人员名册供其选择还是让受访人自己提名——将 
选择方法分成了两 种：固 定名单选择法和扩展选择法 ( Dor ¬ 
ian & Woodard . 1992)。在固定名单选择法中，受访人被限 
定于在研究者和知情人士事先所确定的行为人名单中，报告 
其社会联系。在扩展选择法中，受访人可以不用参照某一名 
单而是按照自己的意愿确认其他行为人。扩展选择法的运 
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用非常类似于滚雪球抽样法的程序。在多利安和伍达德 
(Doreian & Woodard , 1992) 的一项关于小孩和未成年人服 
务体系项目机构的研究中，任何得以涵盖在此网络关系中的 
服务机构必须满足下面两个条件中的一 个:现 任机构主管至 
少引用三次，或服务员工至少提名五次。低于上述提名门槛 
次数的机构将被淘汰出局。多利安和伍达德的报告中指出, 
固定名单选择和扩展性选择得到的网络结果，在几个方面都 
存在很大差异，其中包括行为人数量、关系节点数量、关系点 
的密度和质量等(关系点的密度是通过将观测到的双向关系 
点数除以所有可能的关系点数得出来的，关系点的质量是知 
情人士对关系的满意度、可延展性及价值的估量）。特别需 
要指出的是，固定名单法只从总行为人中选出50%的行为 
人，40%的双向关系节点是通过扩展性选择方式发现的。固 
定名单选择方法更容易产生非随机性抽样偏差，也就是说， 
它总是产生一套核心行为人名单，而系统性地排除了边缘关 
系行为人。这个方法会有个不好的结果，即得到一个没有结 
构性背景的关系网络。除非有条件可以确保两种方法都得 
到一个相差无几的网络，否则固定名单选择法并不能作为扩 
展选择法的替代方案,即便它有管理成本低的优势。 

最后一种关系策略是 K 核心法。赛德曼 （ Seidman , 
1983) 提出了 K 核心的概念，用于发现在一个大网络中的行 
为人子集。这些行为人子集一般包括许多的小团体，小团体 
之间关系微弱，但是在团体内却团结紧密 （Yang & Hex - 
moor , 2004)。假如在一个小团体中，每一个行为人与至少 K 
个其他行为人存在联系，则这个小集体就是一个 K 核心。通 
过改变 K 值，研究者可以为某一网络的边界设定或宽或窄的 
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限制标准。多利安和伍达德 (1994) 运用扩展选择法，描述了 
K 核心概念是如何用于定义和确定网络边界的(我们将在本 
书第4章更详细地讨论 K 核心法)。通过改变 K 的阈值，研 
究者能够使一个非常大而松散的网络边界重新得到划定。 
当 K 值高时，边界标准更严格 ; 当 K 值低时，边界标准更宽 
松。为了实用目的，多利安和伍达德 (1994) 推荐使用一个低 
K 值，以便建立一个更全面的网络边界。相对来说，一个涵 
盖范围更广的网络更少受到抽样偏差方面的质疑，同时研究 
者随后总是可以运用高 K 值来构建一个更加严格紧密的关 
系网络。然而，一个涵盖范围大的网络却会带来更重的数据 
收集任务 : 虽然低 K 值会使得网络范围更宽，但是研究者在 
每一轮都必须访谈数量巨大的研究对象，而这是一项花费巨 
大且容易犯错的任务。降低 K 值门檻也会给整个网络节点 
的数量带来指数增长而非线性增长。虽然目前 K 核心法的 
实际运用非常少，但是我们相信，在界定网络边界的实证研 
究中，它具有巨大的潜在价值。最近网络分析软件的发展应 
该便利了 K 核心法的使用。 

基于事件的策略 


这一方法在划定网络边界时，根据发生在特定事件和地 
点中的行为参与者而定 （Marsden， 2005; Scott, 1991:60)。 
例如，弗里曼和韦伯斯特 (Freeman & Webster, 1994) 在南加 
州海滩观察休闲人士时，将范围限定在一个月内至少有三天 
会来海滩的人士。他们共收集了 353个事件的参与人，其中 
包括43位规律性光顾海滩的爱好者。基于事件参与的涵盖 
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规则完全不同于位置策略法和关系策略法，后两者都忽略了 
行为人的行为。 

由于基于事件的策略依赖具体的行为或事件来确定网 
络边界，因此如何对这类行为进行合理归类就显得非常关 
键。对于基于事件的分析来说，最让人畏惧的便是为选择能 
够回答具体研究问题的事件提供充分的理由。研究人员能 
够涵盖那些中立观察者认为是重要的，或者知情参与者认为 
是重要的事件。基于事件的边界界定方法易于因忽略某些 
重要的行为和参与人而导致获得不完整数据或者缺失数据。 
对于依靠一个单独事件来界定网络边界的研究者来说，这个 
问题尤其敏感，因为许多重要的行为人也许根本就没有参与 
该事件。因此，对多个事件进行观察，一般来说也许可以获 
得一个更加全面的分析网络。由于每一个事件都包含着一 
个潜在的独特的网络小团体，因此同时考察多个事件便得到 
一个可延展的网络边界 :每一 个事件都产生一个独立的网 
络，而其中的参与者部分地与其他事件的参与者相重叠。将 
所有事件的参与者集合起来，便得到一个更加广泛的网络， 
这一网络能够更好地回应研究者的问题。例如，为研究大学 
宿舍里的学生互动情况，弗里曼和韦伯斯特 (1994) 对咖啡馆 
和宿舍这两个不同环境中的社交聚会的事件参与者进行了 
观察。 
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第2节 I 数据收集过程 



这一节讨论构建数据库的几个基本的网络数据收集过 
程，包括单个和多个提名生成法，全部个人网络关系的测量， 
位置选择法和资源选择法，以及档案资料的使用。 

单个和多个提名生成法 

提名生成法常用于自我中心网络关系研究，其通过调查 
问卷从每一个主体受访者那里收集与主体有直接联系的关 
系客体间的相关关系的信息 （ Marsdenm ， 1987)。自我中心 
网络关系研究者依赖于两种调查工具 : 提名生成法和姓名阐 
释法。提名生成法确定调查对象的关系客体，姓名阐释法则 
获得每一个关系客体自身、关系客体之间的关系，以及其与 
关系主体之间的关系的信息 ( Marsdenm ， 2005)。首先，主体 
受访者被要求提供一定数量的人名，这些人名与其有某种特 
别联系。接着受访者会被问及他/她所提供的人员之间是否 
有特别联系。最后，受访者还得提供每一个关系客体的具体 
特征，比如年龄、性别、种族和教育程度等。 

根据研究目标的不同，自我中心网络研究可选择利用单 
个或多个提名生成法。单个提名生成法依靠一个调查问题 
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来引出关系客体的名字。1985年美国综合社会调查中关于 
美国人的核心讨论圈的问题模块，生动地体现了这一方法设 
计 (Burt ， 1985； Marsden ， 1兆 7 )。在 GSS 问卷中，为了引出 

受访者的知心朋友网络，访谈员 会问： 

大多数人总是会与其他人讨论一些重要的事情。 
那么，请你回顾一下过去六个月当中，你与谁讨论过重 
要的事情？你只需要说出他们的名字或者名字缩写就 
可以。 

访谈员记录每个受访者说出的六个名字，然后继续问 
到 :“你 感觉跟所有这些人的关系都是一样的吗？（如果不) 
那么其中哪一个是你觉得关系特别近的？（可以接着试探再 
问 :还有 其他人 吗?) ”之后，他们会问受访者关系客体之间的 
联系： 


请想想你刚才提到的那些人之间的关系。一些人 
之间也许完全陌生，他们即使在大街上碰在一起，互相 
也认不出来。一些人之间关系也许特别亲密，跟他/她 
和你的关系一样好甚至更好。那么，现在想想甲 和乙。 
他们之间完全陌生吗？或者他们关系特别亲密吗？（试 
探 问：跟 他们和你的关系一样亲密？甚或更亲密？） 


受访者还要求 回答: 他们与关系客体认识多长时间了? 
平均间隔多长时间交谈一次？与受访者之间是什么关系（比 
如配偶、父母、子女、邻居、同事、朋友、顾问)？同时他们也要 
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报告每一个客体的性别、种族、教育背景、年龄、宗教和政党 
认同。 

1985年 GSS 的受访者平均只有 2 . 94个可与之讨论重 
要事情的人，而这些核心讨论圈成员的55%是家庭亲属 
( Marsden ， 1987)。自我中心网络密度测量均值为 0. 61，意 
味着多数关系客体相互之间认识（自我中心网络密度测量关 
系主体所感知到的关系客体间的关系强度，其中0值等于完 
全陌生，1值等于非常紧密， 0.5 值等于其他)。美国人的核 
心讨论圈在年龄和教育背景方面比一般人群更具有同质性。 
性别多样性均值为 0. 68,意味着在绝大多数核心讨论圈中男 
女性别是比较平衡的。相反的是，种族/民族异质性均值为 
0. 05,这一低值意味着绝大多数关系客体都是同一种族的， 
马斯登 (1987) 将这一现象归因于大部分的亲属间提名。 

2004年美国综合社会普査沿用了 1985年 GSS 的提名 
生成法，但是网络规模均值从1985年的 2. 94下降到2004年 
的 2. 08,这是一个主要的变化 （ Mcpherson , Smith-Lovin &- 
Brashears ， 2006)。1985年，一个受访者平均有3个知心密 
友，但20年之后这个数字却变成了 0:几乎近1/4的受访者 
无人可与之交流重要事情。非亲属关系连接点的巨大下降 
导致社会网络更加集中在配偶与父母中，而与公益组织和邻 
居的联系越来越少。受访者与关系客体的同质性持续偏高， 
伴随着教育背景异质性的下降，种族异质性上升。分析推 
测，美国人口特征的变化某种程度上可以解释美国人与日俱 
增的社会孤独感。 

阮、弗里曼、戴、潘和张 （ Ruan ， Freeman , Dai , Pan &- 
Zhang , 1997) 利用 GSS 中的单个提名生成法于1986年和 
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1993年在中国天津进行了两次调查。在这两次调查中，天津 
受访者普遍提出了更多的核心讨论圈成员(均值分别为 4. 58 
和 3. 30)，这比美国1985年的均值 2. 94高出许多，而且天津 
人的核心讨论圈成员中亲属要更少一些。相对于1986年， 
1993年的天津受访者核心讨论圈中较少提及同事和亲属，但 
是更多提到朋友。这些变化反映了中国自1978年以来社会 
宏观结构的变迁，其间中国利用更加灵活的市场雇佣制不断 
替代终身雇佣制。伴随着变迁的持续，人们逐渐发展了更多 
工作圈之外的社会关系，因此导致核心交往圈中其他关系人 
的加人机会的增加 (Ruan et al . ，1997)。 

1985年 GSS 调查问卷在利用提名生成法时并没有关于 
所谓“讨论重要事情”的内容提示，而是将解释这一术语的任 
务交给了受访者。这种模糊处理可能使不同受访者对此有 
不同解释，从而影响自我中心网络的结构或组成 (Bailey & 
Marsden , 1999)。例如，受访者如果将“重要事情”界定为个 
人和家庭事务，那么他将更多地提名联系紧密、有亲属关系 
的网络成员，而将“重要事情”界定为与工作或政治有关事项 
的受访者则较少提名亲属成员。为了仔细研究受访者在解 
释“讨论重要事情”时的认知过程，贝利和马斯登 （1999) 使 
用共时有声思维方法，对50个受访人进行调查。首先问这 
些受访者提名生成法使用的标准问题，接着立即用各种试探 
方法研究他们的思维过程。大多数受访者将之解释成个人 
问题，如家庭问题或个人间的问题。虽然先前的调查问题 
会明显引导受访者用其他方式解释“重要问题”，但是这些不 
同的解释并不会形成实质性不同的网络构成。为了方便将 
来运用单个提名生成法，贝利和马斯登 (1999) 提出了四种可 
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选策略。第一种策略将定义内容与诱导关系客体分开 :受访 
者首先被要求根据自己的理解定义重要事情，然后根据其定 
义来提名客体。第二种策略使用举例法来解释重要事 情:研 
究人员提供一些例子，来帮助受访者定义有关重要事情。第 
三种策略中，研究人员为每一位受访者明确解释重要事情的 
含义。第四种策略则利用调查问卷问题次序的不同排列，来 
弱化有关问题背景对受访当事人理解重要事项的影响。 

虽然单个提名生成法产生一个关系客体的核心集合，但 
是它所得到的联系人只是利用多个提名生成法所得名单的 
一部分。研究人员通常会对单个提名生成法所得的核心问 
题之外的各种常规行为感兴趣。在一个关于“朋友”概念的 
有趣研究中，费希尔 ( Fischer ，1982) 发现人们使用这一相同 
的概念来描绘完全不同的关系。费希尔没有采用单个提名 
生成法，而是采用了多个提名生成法。这一方法包含九个事 
项，如家务、询问合适的贷款数额、社交、讨论有关工作、业余 
爱好以及其他个人事情等等。在北加州的调查中，他从每一 
个受访者处获得数量不等的客体名单(从2个到65个），平 
均下来每个受访者提供了 18. 5个名字。而且，受访者将其 
中11个人视为朋友，很显然各人对于“朋友”的定义五花八 
门，包含了各种人际关系。在以色列进行的同样两项调查， 
平均得到14个和11个姓名 （Fischer & Shavit , 1995)。结果 
发现，以色列人比北加州人有着更高密度的自我中心社会 
网络。 

为了比较单个和多个提名生成法，阮 (1998) 在中国天津 
调查时使用了 11个提名生成法。除了利用 GSS 中的重要问 
题项外，她还利用了一些工具性连接点，比如家务和借贷，还 



第 3 章数据收集 


43 


有一些表达性关系，比如社交、谈心和寻求建议。 GSS 提名 
法平均得到 3. 30个天津人的关系客体姓名，而其余十种提 
名法总共得到 8. 17个名字。而且，受访的中国人将“讨论重 
要事情”当做社交性表达事项，大多数受访者将与其社交的 
朋友(出去聚餐、购物或者游玩)视为他们讨论圈中的成员。 
相反，由工具性提名生成法所得到的名单更少被涵盖在核心 
讨论圈网络中。 

由“认识”提名生成法可得到最大的自我中心网络。这 
种提名法要求受访者报告其认识的所有对象。奇尔沃斯、约 
翰逊、伯纳德、雪莱和麦卡蒂 （ Killworth ， Johnsen , Bernard , 
Shelley &- McCarty , 1990) 的研究表明，在美国和墨西哥，这 
种认识提名法可以产生1500名认识对象。然而，为了获得 
与受访者有实质性联系人员的可操作名单，必须对此施加一 
些严格条件。坎贝尔和李 (Campbell & Lee , 1991) 总结了四 
种限制提名生成法的典型条件:（1)角色/内容限制，将受访 
者限定在一种或几种关系中进行提名； （2) 地域限制，将受访 
者所提关系人限定为居住于一定 区域; （3) 时间限制，要求受 
访者所提关系名单限定在一段可回溯的时间 段内； （4) 数量 
限制,让受访者在符合标准的人员名单中只提出 N 个关系人 
(比如，三个你最好的朋友）。大多数提名生成法综合采用上 
述四种限制条件的其中几种。例如•坎贝尔和李 （1991) 
请690位纳什维尔受访者利用其所居住位置地图，说出离 
他/她所知道的最近的9所或10所房子邻居的姓名。之后 
他们又要求受访者确认在过去的6个月中与之聊过至少10 
分钟或到访过该家的邻居。相比其他几种提名生成法，1985 
年 GSS “讨论重要事情”提名生成法在内容、数量和时间段上 
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的限制最为严格，因此也只得到一个网络密度最高的最小自 
我中心结构网络规模(均值 3. 01) 。费希尔的北加州调查，利 
用多个提名生成法，获得了一个最大规模的网络（均值为 
18. 5)，但是其网络密度也最小。纳什维尔调查中的关系持 
续时间是最长的，因为没有设置空间方面的限制， GSS 调查 
中的关系联系频率是最高的。坎贝尔和李 (1991) 的研究使 
人们了解到，通过提名生成法所施加的限制条件是如何塑造 
一个目标网络的结构。 


位置选择法和资源选择法 


社会资源理论的基本假设是，社会结构——由财富、权 
力和地位来定义——是金字塔型和分等级的，社会资源及其 
取得路径正是嵌在这种社会结构之中 （ Lin , 1982； Lin & 
Dumin , 1986)。虽然有许多研究考察了社会关系连接点是 
如何成功地催化功利性行为的，但是一直以来却很少有研究 
者对取得社会资源的路径进行分析。为了解决如何衡量行 
为人的社会资源这一实证问题，位置选择法要求受访者报告 
其是否在某一社会位置上与他人具有联系。处于社会等级 
结构中的某个位置是社会资源的一种合理指标，在此意义上 
调查某个位置上的人的个人交往关系不仅可以显示其拥有 
何种社会资源，还可以显示其获得社会资源的途径。 

如何通过位置选择法反映社会资源获取途径，主要依赖 
社会位置的选择。林和杜敏 (Lin Dumin , 1986) 从1970年 
美国普査职业分类指标中选择了 20种频次最高的职业。这 
些职业在白领和蓝领工作领域的上层和下层均有所分布。 
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受访者报告其是否在这些职业位置上有任何社会关系，比如 
亲戚和朋友(指有较紧密联系的人)或者认识的人(指有较弱 
关系的人)。利用1975年数据库(含位置选择法)来考察寻 
找工作的过程，林和杜敏 (1986) 发现，关系力度与较好职业 
的获得这二者之间的联系与受访者的出身是相关的，比如受 
到父亲职业的影响。当受访者岀身社会上层时，强的和弱的 
社会关系连接点对于获得较好职业的作用基本平等。但是 
当受访者出身地位低时，弱社会连接点比强社会连接点能提 
供更高社会地位的工作机会。随后，林、傅和宋 ( Lin，Fu & 
Hsung , 2001) 将位置选择法用于研究台湾的职业声望与收 
人的关系。他们的报告指出，台湾社会在获取社会资本方面 
呈现出性别不平等现象。社会资本更有利于男性获得声誉 
好的职业和高的收人，然而对于女性来说，她们更依赖人力 
资本(比如教育)来获取较好的工作和收入。 

哪些职业要涵盖在研究范围之中，这是利用位置选择法 
进行研究的关键点，当然这得根据研究问题来定。不同社会 
阶层的文化差异与社会网络关系是如何联系的？埃里克森 
( Erickson , 1996) 利用位置选择法对这一问题进行了研究。 
她抽取了三个主要的社会阶层的维度，即对财产、组织和技 
能的控制。由于她的受访者全部都在安全行业工作，因此基 
于技能控制的19种职业均反映了他们安全行业的特性 (8 个 
专业工人，4个蓝领工人，4个警察，2个商业管理者，1个企 
业主)。访谈员给受访者一些提示 :“现 在我要问你，你是否 
认识多伦多地区某一行业里的人？比如，你是否认识任何律 
师？ 请列举一些你知道能与他们聊得来的人员，即使你与他 
们并不亲近。”假如受访者回答说他们认识某个职业里的人， 
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访谈人就会问他们关系的亲密度，比如是否“仅仅认识”，是 
“作为朋友关系的那种认识”还是“作为亲属关系的那种认 
识”。在一项基于性别的社会资本的研究中，埃里克森 
(2004) 根据加拿大普查的数据，特地挑选了 15种男性主导 
或女性主导的职业。她问受访人是否认识每种职业中的女 
性或男性。埃里克森 (2004) 发现，男性认识由女性主导职业 
中的人的可能性比女性认识由男性主导职业的人的可能性 
更大。而且，因为男性在许多社会部门都占据较为重要的职 
位，所以男性在社会网络中的优势难以改变，尽管相对于女 
性，两种性别都更倾向于与男性有更加多样的关系联结点。 

位置选择法得到的自我中心结构网络，能用于测量个人 
在社会等级中与多个职业的连接关系。社会资源依照职业 
结构的金字塔型和分等级的不同层级进行分配，在此意义上 
位置选择法所得到的不仅仅是人们获得不同职业的途径，还 
是人们获得不同社会资源的途径。然而，人们常常获得超层 
级的关系客体提供的功利性和表达性帮助，而位置选择法却 
将选择限制在某些职业之中。研究人员常常对个人的社会 
资本宽泛地定义为人们从各种社会联系中获取的所有类型 
的帮助。资源选择法主要关注个人社会资本，由函数表达为 

SC = ，其中 j 指社会资源项， Sj 指测算这类资源的可 

获得性 (Van der Gaag Snijders , 2004)。 与位置选择法询 
问当事人是否与特定职业有联系不同，资源选择法询问人们 
是否认识可利用某种具体资源的人。范德加格和斯尼德斯 
(Van der Gaag Snijders , 2004) 询问荷兰的受访者，“请问 

您是否认识谁可以帮助做……”(有35种选项，从“修自行 
车”到“礼节性拜访”)他们报告说，17个资源选择项目形成了 
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四个亚层次，这些亚层次具有内在的同质性，但可关联性较 
弱。其中测量获得教区牧师这样有声望的职位的亚层次，与 
林和杜敏 (1986) 的位置选择法非常相关。但是，获取信息和 
获得工具性支持比如帮助搬家)的两个亚层次与位置选择法 
相关性很弱，因此形成了独特的社会资本维度。 

测量全部个人网络 

一些研究人员对测量全部个人网络感兴趣，因而创造出 
多种提名生成法来达到目的。全部个人网络指的是行为主 
体认识的所有关系。依据具体方法，全部个人网络规模可达 
250个至5000个 （Freeman & Thompson , 1989； Killworth ， 
Bernard McCarty , 1984)。 

在名单核对法中，研究人员首先随机选出几个姓名（或 
姓或名），然后将这些姓名读给随机挑选岀来的受访者，问他 
们:“ 你认识叫这个名字的人么? ”当受访者说认识某一个名 
字时，访谈者便问他/她有关该人名的信息。麦卡蒂、伯纳 
德、奇尔沃斯、雪莱和约翰逊 ( McCarty ， Bernard , Kill worth , 
Shelley & Johnson , 1997) 利用一组 50 个名字的名册访谈了 
793位佛罗里达民众，采用的就是这一方法设计。访谈者请 
受访者报告与名册里名字相同的朋友的联系。研究要求受 
访者通过外貌或名字知道对方，并且他们在最近两年里有过 
联系。麦卡蒂等人 (1997) 通过这种办法获得了最多14个关 
系客体的一个名单，但发现这个名单样本中黑人、西班牙裔 
和亚裔的代表性偏低。然而，他们认为在发掘一个更具代表 
性的全部个人关系网络样本上，这一方法依然优于其他办 
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法。认识名单所列某一名字的受访者比例，与美国人中拥有 
同一名字的人口比例，二者高度相关，这正表明该方法的偏 
差是不严重的 (McCarty et al . ，1997： 311)。 

在反向小世界方法 (Reverse Small-World Method ， RSW ) 
中，研究者首先创造一个虚拟的目标，其中包括名字拟造的 
人员、随机分派的地址、年龄、性别、爱好、成员资格、职业以 
及其他社会经济特征。之后他们要求知情人提供有关的关 
系客体，而这些人员能直接提供一个信息给虚拟目标，或者 
形成一 个指向 目标的网络连接点。明确了关系客体之后，研 
究者便向知情人士也就是受访者询问这些关系客体的个体 
特征、与知情人的关系、关系客体之间的认识程度。奇尔沃 
德等人 (1984) 利用 RSW 方法访谈了佛罗里达杰克森维尔的 
15个知情人士，获得了 100 个 虚拟美国人和400个虚拟国际 
人士的信息。这些知情人士提供了大约134个关系客体，通 
过这些客体与这500 个 虚拟对象联系起来。大多数关系客 
体(86%)是知情人士的朋友，而且超过一半都是男性。 

弗里曼和汤普森 （Freeman & Thompson , 1989) 认为， 
RSW 方法只能获得一个人全部关系网络的一部分，因为知 
情人不可能提出超越虚拟目标数的其他关系客体。为了解 
决这个问题，奇尔沃斯等人 （1990) 将 RSW 、 名单核对法和 
GSS 提名生成法综合起来。他们发现，佛罗里达人的个人全 
部网络关系规模平均是1700人，而墨西哥城居民的平均值 
是600人。利用同样的数据资源，伯纳德等人 (1990) 调査了 
上述不同方法中的重合部分。他们发现 GSS 提名生成法和 
多重社会资源提名法总共才获得 RSW 提名法所得个人全部 
网络关系数量的18%。名单核对法(通过姓氏核对)得到的 
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个人网络关系数量最大。. 

档案资料 

档案资料数据为社会网络分析提供了许多有用的信息， 
虽然这些信息原先并不是为了网络研究而收集的。与专门 
调查相比较，档案资料相对而言使用成本低，对受访当事人 
不会造成时间和精力上的负担，而且当数据是重复收集的 
话，档案资料有可能保留一些非常难得的纵向信息。档案资 
料来源形式多样，包括网页、个人信件、专利摘要、书籍和论 
文文献，以及电脑网络交流文本等。几个在线数据供应商， 
比如 Lexis / Nexis、Free Edgar、SDC Platium 以及美国专利 

商标局等，存储了大量有关公司董事会、战略合作伙伴、小企 
业主以及专利摘报等信息，极大地方便了研究人员对商业组 
织网络的研究。 

档案资料检索新技术的出现总是层出不穷。利用互联 
网这一巨大丰富的个人信息库，亚当米克和阿达尔 (Adamic 
& Adar , 2003) 发展了一种技术，用来发掘其中的人际关系 
网络。他们用一种客户端软件，调查两个大学(斯坦福和麻 
省理工)服务器上个人网站的网页内容。他们关注每一个主 
页的文本、外部链接、内部链接和邮件名单。他们这种发掘 
互联网内容的创新尝试，不但了解到谁认识网站主人这类信 
息，而且还了解到他们的认识是在何种社会情境中发生的。 
例如，麻省理工的学生倾向于通过大学生联谊会及其下属组 
织来互相认识，其中提名最多的十个社交场合有五个是大学 
生联系会之类的组织。比较而言，斯坦福的学生之间的认识 
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渠道更加多样化，比如通过研究团体、宗教组织、文化交流机 
构以及学生联谊会等。 

个人书信和电子邮件带有大量有关个人交往的信息，因 
此分析检查这些资讯文本会得到有关个人网络和社会结构 
方面的丰富信息。这种方法对历史学家尤其有利，因为他们 
所研究的古代社会现在是不可能去调查的。例如，亚历山大 
和达诺夫斯基 （Alexander & Danowski , 1990) 通过西赛罗 
( Cicero ) 的书信，对古罗马的社会结构进行研究。西赛罗是 
古罗马著名的演说家和有影响力的政治家，他跨越两大社会 
精英阶层 :无官 职的“骑士阶层”和有官职的“元老院阶层”。 
研究者查阅了 280封西赛罗18年间与他的熟人、朋友、亲属 
的通信。他们的数据管理程序记录了 524个人之间的1914 
种关系，包括关系双方的姓名和官职，以及诸如送礼、预约、 
中间调解、帮助、负面描写、拜访等关系内容。该研究一个主 
要的发现就是，虽然元老院成员和骑士在某些事情上互相对 
立，但是他们似乎构成了一个单一的、整体融合又互相牵制 
的社会阶层。 

期刊和专利都含有大量引文名单，因而为社会网络研究 
提供了另一个很好的数据来源。哈根斯 （ Hargens ，2000) 对 
三门自然学科、三门社会学科、一门人文学科的引文模式进 
行了研究。对每一门学科，哈根斯首先确定一个期刊清单， 
这一系列期刊使用引文索引服务和专家咨询服务。然后他 
记录每一篇论文中引述其他文章的参考文献或脚注，从而为 
每一个学科领域建立了一个全面的引用关系网络。哈根斯 
发现研究者因各种目的而引用他人文献，从认同一个普遍的 
理论流派到纠正某一具体的计算过程。特别需要指出的是， 
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自然科学的文献引用大多数是为了拒绝或更正某一具体实 
验方法，而社会科学家绝大多数是为了认同或挑战某一学科 
的基本假定。在对之前的文献进行争论方面，人文批评领域 
往往要比自然科学和社会科学界更为盛行。 

对于有志于研究知识流动的人来说，专利授予过程产生 
了可资研究的丰富数据。在对专业技术市场的研究中，波多 
尼和斯图尔特 (Podolny & Stuart , 1995) 深入分析了专利摘 
要的文献引用。为了获得专利，技术发明者要向美国专利局 
提交申请书。作为申请程序的一部分，他们必须列出作为此 
次申请重要基础的所有已授权专利。专利审查员需要确 
认引文清单包括了所有之前的相关发明。利用 Lexis/Nexis 
在线数据库，波多尼和斯图尔特 (1995) 分析了自1976年至 
1991年间授予全球半导体技术创新者和制造者的所有美国 
半导体设计专利。他们将专业技术市场看做由一系列技术 
创新构成的，这些技术创新之间是由一种创新到另一种创新 
的知识流动链进行连接的。因此，每一项授权专利都是一个 
进人已有技术市场的新的重要的技术创新。一项创新技术 
的专利摘要文献，提供了与之相关的所有前人的基础性创新 
信息，而基于此项发明的后一项专利也表明它们之间的联系 
是建立在此项重要创新之上的。因此，一个专业技术生态位 
构成了一个自我中心网络，该网络是由某个重要创新及它与 
其他专利发明之间的联系形成的。 

虽然调查文献引用清单可以构筑学者或专利人之间的 
关系网络，但是其中有两点重大差异 ( Meyer ， 2000)。第一， 
期刊论文倾向于引用大范围的已发表文献，而专利引用范围 
较小，往往只引用对此项创新有重要贡献的前人发明。第 
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二，期刊论文引述目的较广，比如赞赏有关论著、纠正前人工 
作或者与某人争论某个观点 ( Meyer ， 2000)。相反，专利摘 
要文献引述的目的就单纯多了，就是为了感谢前人的工作为 
当前的创新提供基础。因此，利用专利文献和期刊论文所建 
构的社会网络可能在内容上有根本性差别，需要研究者仔细 
甄别。 

政府机构和经济组织在雇员间的交往以及有影响力的 
组织间的互动上，已经累积了大量的信息。然而，这些有价 
值的数据资源普遍被忽视，组织理论者对此也少有问津 ( Per - 
row ， 1986：172 一 173)。 一 个例外是贝克 （ Baker ) 和福克纳 
(F aulkner ) 的研究，他们利用了基福弗 （ Kefauver ) 特别委员 
会报告。这一报告是该委员会在美国参议院反垄断司法委 
员会上关于商业合谋的证词。通过这个报告，作者揭示了非 
法商业关系网络的结构及其动因。 

自20世纪90年代以来，随着电脑网络技术的迅速应 
用，电子化交流不再局限于少数技术专家，而是迅即扩展到 
普通民众。新技术用于控制或激励网络使用者的交流，从而 
让研究人员便于研究它、揭示它的模式。社会网络研究者通 
过检视这些电子化交流 ( CMC ) 系统，比如电子邮件、电子公 
告栏、语音信息和其他交友软件，获得了丰富的社会网络数 
据 （ Rice ， 1990、1994; Rice , Borgman，Bednarski Hart , 

1989)。 由于监控程序普遍都可存储所有的 CMC 系统的交 
流，因此它的网络数据便构成了此系统使用者间所有交往的 
一个普查。然而，对于网络分析人员来说，检查分析每一项 
交往，在计算时间和成本上将会是不可承受的。更为重要的 
是，由于这种电子化交流在内容、时间和目的上都呈现多种 
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形式，因此并不是所有的交流数据都是有用和相关的 。 CMC 
研究者通过三个原则甄别数据:（1)在基于角色的研究中，研 
究者过滤那些基于角色——比如经理或者会计——的信息 
发送者或者接 收者; （2) 在基于时间的研究中，研究者设定一 
个时间段，在此时间段内收集所有交流 信息； （3) 在基于内容 
的研究中，研究者过滤一些内容和主题，而只选择那些符合 
研究问题的信息。客户端计算机软件通过关键词对大型网 
络数据库进行快速搜索，极大方便了基于内容的研究。 

与自填式问卷调查相比， CMC 分析方法的强制性较弱， 
且具有更小的测量误差。例如，当两个人自填的关系不一致 
时，要发现这些测算错误的来源，比如回忆不准确、回答有 
偏、问卷用词问题等，就变得几乎不可能了 （ Rice ， 1994： 
176)。然而，计算机控制网络数据能够精确地反映 CMC 信 
息的内容，因此有关相互关系的假定就能够得到明确的区分 
和验证。虽然 CMC 数据比自填式问卷得来的数据更精确， 
但他们并不一定更有效。他们通常展现人类交流的不同方 
面 ( Riceetd . ，1989)，例如，电子邮件交流能更准确反映工 
作行为而非朋友间和家庭成员间的社交行为。作为使用工 
作服务器电子邮件系统协议的一部分，雇员普遍都签署了协 
议同意自愿分享他们的交流。因此，依据研究主题的不同， 
研究者应当对 CMC 系统产生的数据保持警醒。对某一公司 
服务器用户的电子邮件交流进行监控检查，可以获得关于工 
作联系结构的丰富数据，但是却很难获得雇员业余时间的关 
系结构数据。单独依赖 CMC 系统也可能会错失一些非常重 
要的细微交流之处。大量信息内容是不重要的例行公事，偶 
尔会有一条非常重要的信息，忽略这样的信息也许会产生严 
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重后果。因此，研究者应当对 CMC 数据分析保持警惕，因为 
这种方法虽然揭示了有价值的背景线索，但同时也丢掉了一 
些交流行为中的重要的东西 ( Rice ， 1994:177)。 

CMC 技术的最新发展大大延伸了网络的运用，便利了 
社会网络分析 (Berman & Brady ， 2005)。网络基础设施包括 
诸多网络工具 :比如 高性能计算机和网络，个人电子设备(即 
时信息工具、黑莓手机和个人数字化助手），数据获取、管理 
和分析服务，可视化设施等。网络基础设施为社会网络分析 
提供了大量新的机会。例如，高性能计算机服务器记录万维 
网和个人电子设备使用者的文本信息。对这些文本信息进 
行分析会得到重要的社会交往模式和网络构造。大量的机 
会同时也带来巨大的挑战，从如何获取、存储、分析海量数据 
这些技术问题，到如何确保获得知情同意权以及保护隐私等 
法律和社会的问题。因此，网络基础设施所支持的社会网络 
分析，要求多学科之间进行前所未有的合作，包括社会科学、 
法学、电子学和计算机科学等。 

亚当米克和阿达尔 （2003) 利用网络工具获取和分析巨 
量数据的研究就是一个很好的范例。这些数据信息在网络 
空间流转，通过对它们的分析，深化了我们对社会网络中某 
些重要事件的理解。为了研究小世界现象，他们从惠普公司 
实验室员工的电子邮件和超过2000名斯坦福大学学生的社 
交网页中，收集了大量信息。这个交流网络包含流通在430 
个人之间的4000封电子邮件。这些人在3个月的观察期 
内，每人至少交换过6封电子邮件。网页网络数据来源于一 
个社群网址 Club Nexus ， 它邀请斯坦福大学学生加入该俱乐 
部并且登记他们的朋友圈。登记过程中也要求登记人报告 
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他们的专业、性别、个人特征、宿舍地址、爱好等。朋友也被 
请求回应登记在 Club Nexus 的关系。未得到回应的关系将 
从数据库中删除。为了定位交流目标，亚当米克和阿达尔对 
被观察电子邮件网络使用了三种搜索策略，每一种都反映了 
一个潜在的理论观点。髙相关度寻找法选择那些通过认识 
很多人来了解研究对象的个人。第二种便是将信息传递给 
在组织等级架构层级中离研究对象最近的联系人。第三种 
便是将信息传递给在空间距离上离研究对象最近的联系人。 
在两种网络中模拟这三种策略后，亚当米克和阿达尔认为第 
二种——位置搜索发现了实验室网络中关系双方的最短路 
径。然而，没有任何一种搜索方法得到了俱乐部网络的最短 
的合理路径。 
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第3节1认知社会结构 


虽然关于社会网络最普通的问题之一可能 是:“ 谁认识 
谁?”但是，与认知社会结构 (Cognitive Social Structure , CSS ) 

分析最相关的问题也 许是: “谁知道谁认识谁? ”研究者使用 
CSS 数据调查知情人对于网络关系的认知的变化。虽然知 
情人可能是外在的观察者，但是他们也是其所报告的网络的 
参与者。为了创建一个 CSS 数据库，研究者要求每一位参与 
者报告他/她对于每一个对偶网络关系的主观认识。例如， 
使用一个涵盖所有双方行为参与人的名单，去核对所指关系 
的感知性存在。对于某一个具有 N 个行为人的网络，一类关 
系的完整 CSS 数据库含有 N 个认知图，这些认知图标明了每 
一个参与者一知情者视角下关系连接点的显现与缺失。鉴 
于可能需要大量的时间和回忆的负担——每一个知情人需 
对具体的有向对偶关系进行 N 2- N 次判断， CSS 数据收集 
工作常常限于非常小规模的网络，或者一个有限的任务范围 
(例如，“谁是 X 的三个最好的朋友?” “ Y 最信任哪五个 
人?”)。举例来讲，克雷克哈德 ( Krackhardt ，1987) 收集了 21 
个管理雇员中的两种类型关系的 CSS 数据——建议寻求和 
友谊，得到了两套各21个认知图，每套展现了（21) 2 — 21 = 
420个有向联系。每个自我中心网络都是一个 CSS 特例，其 
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中知情人只描述所观察到的他/她的直接联系人之间的关 
系，而不是与所有其他网络成员间的联系。 

CSS 数据库的两个普遍运用是:（1)判断参与者对网络 
结构认知的一致性 程度; (2) 通过与某些准则进行比较，评估 
所观察网络结构的认知偏差。一致性是指两个或更多的知 
情人对社会关系判断或评估的同意程度。一个重要的理论 
问题是，具有相似个人特性（比如种族、性别或年龄）的行为 
人之间的一致性程度是否更髙？或者共享关系连接点(或位 
于相似网络位置）的行为人，是否更有可能在网络关系的认 
识上达成一致？偏差指知情人通过某一准则的比较，达到对 
网络认知的准确性程度(更多关于知情人偏差的问题，请参 
看后面章节)。其中一个准则是所有其他参与者所认知的网 
络的集合。另一个准则是从参与人行为的直接观察中所获 
得的关系数据。对自填式问卷测量与关系行为测量之间的 
较大差别，网络分析者已经观察很长一段时间了，并且已提 
出解决这种差别的办法。虽然大部分网络数据是通过面对 
面或者电话访谈获得，但是大部分研究人员很少注意受访人 
或知情人的认知社会结构，而这种认知社会结构会塑造知情 
人的回答。分析者一般将所有的反映当做明确客观的社会 
事实。然而，一些学者已经寻求理解和测算基于受访者认知 
获得的信息与行为观察之间的差异来源（如 Batchelder , 
2002; Carley &- Krackhardt , 1996； Casciaro ，1998； Free ¬ 
man , 1992； Johnson & Orbach , 2002； Koehly & Pattison ， 
2005 ； Krackhardt , 1987)。 

认知社会结构也帮助研究者确认受访者自我填答时出 
现的系统性认知误差。昆巴萨尔、罗姆尼和巴切尔德 ( Kum - 
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basar，Romney &- Batchelder , 1994：) 访谈了 2 5 个计算机硬 
件工程师，构建了一个认知社会结构。每一个知情人都被提 
供给一个随机抽选的工程师的名字，然后被要求从整个25 
个工程师名单中标注一个人，他们认为这个人是随机所选工 
程师的朋友。这一过程对所有的名字重复执行，包括知情人 
自己的名字。然后利用代数矩阵方法(参见第4章），获得的 
25个认知图能够整合到一个横跨所有工程师一知情人的全 
幅网络。昆巴萨尔等人 （1994) 将自我认为的朋友网络与全 
幅网络相比较，得出结论认为，个人倾向于认为更亲近他们 
自己网络表征的中心，而不是全幅网络的中心。另外，个人 
倾向于构建一个具有认知连贯性的网络，也就是说，他们将 
自己看做由朋友所包围的中心，而这些朋友也有大量的朋友 
圈子。 

知情人倾向于构建一个具有认知连贯性的网络形象，这 
一发现并不新奇。关于认知心理学的大量文献认为，当人们 
遭遇关系不平衡时，他们会经历心理或情绪上的压力 （ Hei - 
der ， 1958； Newcomb ， 1961)。随后，面临不平衡关系的个人 
开始启动“平衡计划 ”:他 们改变他们的认知，以求获得这一 
关系的平衡性认知图像。然而，这种认知的调节主要发生在 
朋友关系间，尤其是亲密朋友关系间，而在非朋友关系间人 
们似乎不受这种认知的不平衡所影响。实际上，当个人之间 
没有直接联系时，认知的不平衡很少导致心理上的不平衡。 
因此，知情人虽然尽力保持他们的心理平衡，但是他们还是 
更易于在朋友间提供扭曲的和有偏差的信息,相反他们对于 
疏远关系的报告更少受到偏差和扭曲方面的质疑。 

与这种传统认识形成对比的是，克雷克哈德和凯尔德夫 
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(Krackhardt &- Kilduff , 1999) 从泰勒和费斯克 （ Taylor 
Fiske , 1978) 的认知吝啬者模型中得到启示，认为知情者一 
般都缺乏与他们并不直接联系的远距离关系人的了解。通 
过动员平衡计划来填补信息空缺，知情者在报告远距离关系 
和亲密关系时都会存在偏差。但是，两种偏差的动因是不同 
的: 对于亲密关系来说，平衡计划是用于获取心理和情绪上 
的平衡，但是对于远距离关系来说，平衡计划是用于弥补有 
关联系信息的缺失。克雷克哈德和凯尔德夫 （1999) 调查了 
四家公司的员工，请每一个知情人士报告其同事间的朋友关 
系。他们发现了网络结构与认知平衡间的曲线 关系: 员工认 
为他们的亲密朋友圈和最边缘关系圈要比那些中等关系的 
人更易于平衡。其中一个主要的启示便是，近距离关系和远 
距离关系都容易产生高度信息偏差，这是下一节的论题。 
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第4节 | 信息偏差 


我们将信息偏差定义为自我报告的行为与真实行为之 
间的不一致。对于言词和行为之间的鸿沟，社会科学家早已 
开始进行观察。20世纪30年代早期，理査德 • 拉皮尔 
(Richard LaPierre ) 和一对年轻的中国夫妇开车横穿美国，途 
中他们在184家餐馆吃过饭，在66家旅馆住过宿，并且只被 
一家旅馆拒绝过。旅程结束后，拉皮尔给所有的餐馆和旅馆 
等发信，问他们是否“接待过中国人”。结果，92%的回复是 
“否” ( LaPierre ， 1934)。拉皮尔因此总结，偏见态度的行为表 
现是需要支撑条件的。在另一项研究中，克罗嫩伯格 ( Kro - 
nenfeld , 1972) 询问刚离开餐厅的人，男侍者穿着什么样的服 
装？餐厅又播放什么音乐？许多受访者对服装和音乐提供 
了详尽的信息，但实际上这几家餐厅根本就没有侍者或没有 
播放过音乐。 

信息偏差的来源多种多样。许多受访人对于准确报告他 
们自己行为的要求，并不具备处理这种大量信息的认知能力 
( Bernard , Killworth , Sailer Kronenfeld , 1984)。 另外还有两 

个方面的原 因:知 情人在认知上将某一种归类形式强加至某 
一不归类的附属模型上 ( Freeman ，1992) ;知情人矫正他们的 
认知以便维持亲密朋友间的平衡关系 (Krackhardt & Kilduff , 
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1999)。一些研究人员认为，信息偏差并非随机的噪声，恰恰 
某些受访知情人在准确提供行为信息上的确要比其他一些 
人强。例如，一些研究表明，对受访主题的熟悉往往会有助 
于受访者对事件的回忆 (Romney Weller, 1984； Romney, 
Weller & Batchelder, 1986)。 相反，另一项研究发现，虽然 
对论题知识渊博的受访者遗忘较少，但他们也容易同时创造 
出一些诸如并不存在的关系成员之类的错误 （Freeman， 
Romney &- Freeman, 1987) 0 还有分析发现，所有的受访知 
情人士都倾向于将自己视为更加靠近网络关系的中心，而并 
非如其他网络成员所报告的那样。因此，对某一网络组别层 
面的报告也许要比个人层面的报告来得更准确些 (Kumbasar 
et al. , 1994)。最近几项关于自我中心网络的研究都对信息 
偏差问题进行了考量（如 Brewer, 2000； Feld & Carter, 
2002； Johnson &* Orbach, 2002； White & Watkins, 2000)。 

对于将自填式问卷得到的数据作为网络关系人的真实 
行为数据进行研究的社会网络研究者来说，也许最引人注目 
的消息就是 H. 罗塞尔 • 伯纳德和他的同事们所进行的项目 
(Bernard &* Killworth, 1977； Bernard，Killwoth Sailer, 

1981; Bernard et al. ， 1984)。 他们构建并比较了七套配对的 
交流网络数据库 ：由参 与人自述建构的认知 数据； 由机器监 
控系统或“客观”观察者记录所建构的行为数据。这些数据 
库系统包括:两组华盛顿特区的聋人 TTY (文本电话系统， 
专为听力或语言不便者使用)使 用者; 弗吉尼亚、宾夕法尼亚 
和俄亥俄无线电协会的业余使 用者; 社会科学研究所的职 
员;西弗吉尼亚大学技术教育的一个研究生项目；大学学生 
联谊会驻地;一组电子信息交换系统 (Electronic Information 



62 


社会网络分析 t 第二版 1 


Exchange System, EIES) 使 用者。 例如， EIES 使用者记录自 
述数据(认知网络)和通过 EIES 电子监控系统所得数据(行 
为数据)。所有七组双方交流网络数据包 括:“ 受访人与谁联 
系交流?” “他们多长时间联系一次?” “他们联系多长时间 
了 ? ”通过对这些认知数据和行为数据进行比较，伯纳德等人 
(1981:17) 发现大约一半的自我报告知情人在某些方面是存 
在问题的，并得出如下 结论： 

如果对其要求任何可接受的精确度，人们实际上 
并不能够说出他们在过去特定的一段时间内与谁交谈 
过……我们现在确信，关于交流的认知数据并不能够代 
表同等行为的数据。 


其他一些学者认为，情况也并非像伯纳德和他的小组所 
描述的那样毫无希望。诺克和库克林斯基 （1982:32) 对“客 
观”观察者的准确性和中立性表示怀疑。他们提出如下一些 
问题 :“在 什么程度上这些中立的观察者打扰了正在进行的 
行为? ”“他能够多精确地记录双方的交流? ”“在非观察期他 
们之间的交流如何? ”伯纳德等人 (1984) 后来调整了他们的 
例子，承认尽管在认知数据方面存在一些系统性扭曲，但通 
过一些改进因素可以减少信息偏差，比如让知情人更熟悉文 
化背景，或由访谈者给受访者提供相关回忆提示和帮助。他 
们建议“信息的不准确性不应该导致抱怨或绝望，而应该引 
至一个尚未开垦的研究新领域 ” (Bernard et al . , 1984:513)。 

信息偏差常常以其他系统形式发生。持偏差观点的受 
访者将自己视为更趋网络中心 （Kumbasar et al . ，1994)，而 
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忘却边缘行为人，错误地回忆主要网络成员 （Freeman et al . ， 
1987) ，在认知上矫正他们的认识以达成他们与或近或远的 
朋友间网络关系的平衡 （Krackhardt & Kilduff ? 1999)。信 
息偏差也往往由不准确的回顾所致 （Bernard et al. ， 1981； 
Bernard et al . , 1984)。 不能准确回忆的知情者容易犯两类 
错误:（1)忘记他们与谁交 往过; （2) 错误地回忆实际上从未 
发生的事 (Freeman etal. ， 1987)。而且，遗忘和错误回忆并 
不是随机发生的。知情人倾向于遗忘并不频繁的参与者，错 
误回忆频繁的参与者。弗里曼等人 （1987) 记录了参加9个 
座谈会的大学教师和学生。最后两个会议结束后5天，研究 
者调查了 17位参加过这两次会议的知情人和16位没有参 
加这两次会议但是参加了至少两次之前会议的知情人。研 
究人员问他们参加和缺席会议的情况。这些知情人在272 
个选择机会 （17 X 16 = 272 ) 中犯了 141个错误 (115 个遗忘 
和26个错误回忆）。52%的错误率非常接近伯纳德等人 
(1981) 的估算。伯纳德等人估计过半的知情人自我报告是 
不准确的。座谈会知情人在对其他参与人的了解上，差异较 
大，而这就影响到他们的错误率 （Freeman et al. ， 1987： 
312)。与知之甚少的知情人(他们只在座谈会中与其他人交 
流过)相比，知识丰富的知情人(他们对其他人在许多方面都 
有所了解)更少遗忘，但更多地犯回顾性错误。因此，与通常 
的认识相反，知识丰富的人实际上更容易错误回忆。然而， 
这些知识丰富容易错误回忆的人却是会议的经常参与者。 
由于社会研究的主要关注点是如何测量各种重复行为的模 
式，因此就收集这些数据而言，这些知识丰富的人倒是很好 
的知情人 (Freeman et al. ， 1987)。 
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知情人之间的高度一致常常意味着低误差和高信息效 
度。因此，罗姆尼等人 （1986) 提出一个共识模型，将知情人 
的能力(指知情人了解研究客体的程度)和知情的统一性、有 
效性联系起来。一个核心观点是 :任何 两个知情人答案之间 
的一致性，是每一个答案与真相相关联程度的函数。也就是 
说，相对于无效的回应，有效的回应更容易经常得到同样的 
答案。研究者要求知情人回应一系列问题，而对于这些问题 
只有研究者本人才有标准答案。他们用所答正确数除以答 
案总数的比例来评价每一个知情人答案的“真实”有效性水 
平，用共识模型来评价其一致性有效水平。他们发现知情人 
的真实性准确度与他们的一致性准确度高度相关，因此他们 
也认为一致性的答案往往等同于有效的答案。 

总之，与伯纳德等人 (1981) 宣称的知情人自我报告总是 
错误地反映事实真相这一结论相反，对信息偏差的研究为如 
何更合理利用知情人提供了有益的建议。知识丰富的知情 
人能提供有关长期重复模式的无偏数据，同时他们也能够提 
供一致的答案，而这正意味着更高的有效性。个体认知相比 
于系统对所有网络行为人的综合认知而言，更偏向于将自己 
视为网络的中心。因此，系统认知要比个体认知更能准确把 
握一个人在网络中的定位。另外，自我往往会通过“平衡计 
划”对亲密朋友和较疏远的联系人产生认知偏差。那些利用 
自我中心关系法来收集网络数据的研究者，在分析亲密关系 
和较疏远关系时，应当釆取一些矫正措施。 
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第5节 | 倌度 




从一般意义上来讲，信度是指特定工具用于重复测量同 
一事物时，每次都得到同样结果的一种程度。其中，有好几 
种测量信度的方法，包括观察者间信度、再测法信度、内在一 
致性信度（包含折半信度和 Cronbach a 信度 ）（ Neuman ， 
2000:178—185)。社会网络研究者常常使用再测法来判断 
知情人的信度。例如，对知情人提出或剔除讨论重要问题的 
联系人名册，再测法会在以后的某一时间再次就同一问题调 
查该知情人。比较前后两次反应的一致性程度，即可得知每 
一个知情人的信度。当两次调查中知情人都提供了完全相 
同的核心讨论圈名单时，即这两次测量能够完美对应时，就 
表示完全可信。相反，在一个完全不对应的测量中，知情人 
选择了与上次完全不同的名单，那就意味着完全不可信。在 
操作再测法时，一个关键的问题是两次测量之间的间隔。两 
次测量之间的不同答案，也许反映的是个人网络关系的真实 
变化。实际上，人们不停地发展新的人际关系，他们之间可 
以进行表达性的或实质性的帮助，比如讨论重要问题、搬家、 
照看小孩或者借钱等。方法论者认为，这种颠覆性问题可以 
通过缩短两次测量之间的间隔来减弱其影响 （ Brewer ， 
2000)。间隔时间越短，个人网络产生的实际变化可能就越 
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小，因此这些变化对信度测量产生扰乱的可能性也就越小。 

一个简单的但经常使用到的再测法信度测量是 Jaccard 
系数，它指排除共同负面配对之后的同意部分。它是这样计 
算的 :用知 情人两次测量都提名的人数，除以两次测量中提 
名的总数 ®( Brewer ，2000 ) 。 Jaccard 系数值从 0. 00至 1. 00， 

表示零可信度和完全可信度。下面是一个含有35个姓名的 
虚拟名单，结果显示在交叉表中，单元频率按照 A — D 来 
表 7 K 。 




第二轮访谈 

第一轮访谈 

提名人数 

未提名人数 

提名人数 

A = 12 

B = 5 

未提名人数 

C = 3 

D = 15 


在第一轮访谈中，知情人选择了 17个 提名； 在第二轮中选择 
了 15个 提名； 在这两轮中共有12个人被同时提名。因此， 
Jaccard 系数= A /( A + B + C ) = 12/ (12+5 + 3) = 0. 60。一 

个小组中的每一个知情人可能具有不同的信度，因此一个小 
组级别的 Jaccard 系数便是所有个人系数的均值或中位数。 

知情人信度常常与有效性相关联 （Romney & Weller , 
1984)。假如知情人的自我认知报告只有一部分反映了他们 
的真实行为，那么知情人之间的一致性就往往能够表明知情 
人回忆的有效性水平。例如，针对网球比赛的问题，网球运 
动员应当比非网球运动员表现出更多的一致性。知识丰富 
的运动员也许能够完全一致地回答这些问题，而没有相关知 
识的运动员则会给出五花八门的答案。从这个中心观点岀 


①两次都提名的人算一个人名。——译者注 
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发，罗姆尼和韦勒 （Romney ^ Weller, 1984) 再次分析了伯 
纳德等人的数据库，用于确认那些有效可信的“好的”知情人 
和那些无效不可信的“差的”知情人。他们发现，个人的信度 
与他/她的效度是正相关的。个人的信度通过个人回顾与组 
别整体回顾之间的相互关系来测量，效度则根据个人回顾与 
组别整体数据的一致程度来计算。另外，高信度的人比低信 
度的人更倾向于与其自我报告有更高的相关性。因此，主要 
的发现是，可以通过信度预测效度，具有高效度的知情人之 
间应该要比低信度的知情人之间，具有更多的相似反应。 
而且，知情人应当由他们的信度来加权 :那些 具有更高信度 
知情人的答案应该比那些低信度知情人的答案陚予更高的 
权重。仅就高信度人群这点来说，伯纳德等人的数据中的 
知情人提供了有效的自我报告，这从他们的回忆数据和综合 
观察互动数据的高度一致性能看出来 （Romney & Weller, 
1984:75 )。 

在一定程度上，知情者中忘却某些联系是不可避免的。 
因此，相对于比较自由回忆法，可以采取某些帮助回忆措 
施——比如提供线索或提示的名单——它们的可靠性问题 
更少。比较自由回忆法是指知情人在没有任何帮助的情景 
下进行提名。例如，琼斯和费希尔 (Jones & Fischer, 1978) 
针对某种具体网络关系，比如“借钱”、“讨论工作有关的事 
务”，访谈了 86个人。第一轮访谈中，受访者自由地回忆那 
些关系中的个人。第二轮，研究人员给每位受访者一个名 
单，并且重复了同样的问题。结果第二轮比第一轮多得到 
34% 的人员名单，而且第一轮提名的 27% 在第二轮访谈中并 
没有被提及。 
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在另一项网络信度研究中，布鲁尔和韦伯斯特 (Brewer & 
Webster , 1999) 调查了 217位住在一个大学宿舍楼中的人员。 
第一轮调查要求他们写下居住在这栋大楼的所有朋友的姓 
名。第二轮则为每个受访人提供了住在本楼的人员花名册， 
然后请受访人再次确认他们认识的朋友。利用花名册的提 
示，受访者平均多提出了 20%的朋友名单。而先前忘记的名 
字，多是关系比较疏远的人，这也表明如果没有提示和线索， 
受访者一般会遗忘与他们关系相对疏远的对象。其中一个 
推论是，当一个研究人员将在两次独立的访谈中获得的自由 
回忆数据和基于帮助而得到的数据进行比较时，会出现结果 
非常不可信的情形。在这种情况下，低信度只意味着更高的 
效度 :知情 人在一个访谈中比在另一个访谈中得到更完整的 
提名。当然，信度并不保证效度。一个知情人在两次访谈中 
也许提名完全相同，因此获得完美的信度，然而每轮访谈都 
可能因同时忽略了同样的名字而产生了同样的偏差。不过， 
髙效度的网络反应一般来说具有高信度。也就是说，假如一 
个受访者能够总是根据某一提名法则列举同样的朋友名单， 
那么这个受访人也很可能在不同的访谈时间里选出一致的 
朋友圈子名单。 

由于社会网络数据的特有属性，尤其是在自我中心数据 
分析中，受访者的信度和效度测量与传统的其他种类数据的 
测量差异非常大 ( Marsden ，1993) 0 从较小且封闭的社会中 
抽取的自我中心样本中，知情主体常常提出许多与某一具体 
关系有关的相同的关系客体。知情人之间在选择相似关系 
客体上所体现的高度相关性，意味着知情人的高度可信。同 
样地，知情人对他/她的关系客体特征(如年龄、性别、教育背 
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景、社会地位等)的描述，与关系客体对这些特征的自我报告 
二者之间的高度相关，也意味着知情人的高度有效性(这个 
解释假定所有关系客体的特征都可从其自我报告中获知，从 
而用于作为比较知情人自我报告的事实数据)。 

研究者对肯尼亚乡村妇女间的避孕话题网络进行过一 
个专门调查，揭示了这种自我中心网络方法的信度和效度问 
题 (White & Watkins , 2000)。研究者在1994年12月访问 

了 925位妇女，一年后再次访问了其中的743位。在两次访 
问中，这些妇女都被问及同样的问 题:“ 你与谁商讨有关节育 
问题? ”受访者随后报告其中四个随机抽选出来的关系客体 
的年龄、教育背景、收入状况以及节育措施的使用情况。研 
究人员也询问每一位关系客体自己的年龄、教育背景、收入 
状况和节育措施情况。怀特和沃特金斯 ( Watkins ) 发现，在 
受访者自我报告和关系客体自我报告之间，节育措施情况存 
在最明显的差异。相反，在一些可直接观察到的事项上则存 
在较高的一致性，比如“朋友家的房子是否有一个金属屋顶” 
或“她家里是否有套沙发”。而且，由受访者(提出了同样的 
关系客体)所提的关于关系客体的报告的相关度只有 r = 
0.31，只比受访者自我报告与关系客体自我报告的平均相关 
度 (0.25) 高一点点。这些发现表明，受访者对于关系客体节 
育措施的了解是既不可信也非有效的。第一轮由受访者提 
出的关系客体只有18%在第二轮中提到，这也表明了或者是 
低信度，或者是在受观察年份期间中关系网络的不稳定。 
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第6节 | 数据缺失 


社会网络研究对数据缺失尤其敏感。在自我中心网络 
数据收集过程中 ，一 个拥有 N 个关系客体的关系主体被要 
求报告4个非定向的对偶关系。具体来说， C % = 

'2! XOV -2)! ，其中 Nl (读做 “ N 的阶 乘”） 表示从 1 至 N 的 

所有正整数的乘积。例如，假如关系主体有5个关系客体，则 

c t 二 5! = (1 X 2 X 3 X 4 X 5) ^ 120 

N _ 2! X (5~2)! — (1 X 2) X (1 X 2 X 3) — 一 IT — ; 

因此，关系主体必须对这10种非定向关系给出有关信息。 

对于定向关系，关系客体间的连接点数量就是上面的 两倍: 

2 C 2 V ; 因此，在上述例子中，关系主体应当报告20种定向关系 

点。自我中心网络关系的关系应答率 私等于 所报告关系点 

的数量除以关系客体间所有可能的对偶关系数量。比如，关 

系主体报告了 10种非定向关系中的8个，那么尺= 0. 80,或 

者80%;假如关系主体漏报了 20种定向关系中的6个，那么 

尺= 0. 70,或者70%。 

要计算一个完全社会网络的应答率是比较复杂的一件 
事。 一 个完全的社会网络由网络中 iV 个行为人配对所组成 
的所有双边关系所构成。对于非定向关系来说，尺相对就简 
单些，因为当测量信度较高时，由双边关系中的一方来报告 
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便足够了。例如，为了测算行为人 A 和行为 B 之间的友谊， 
由任何一方知情者所提供的信息即可判断这种朋友关系的 
存在与否。也就是说，除非 A 和 B 的报告都缺失，否则我们 
就可以凭借一方的单独报告来判定友谊的存续。一般来说， 
对于一个含有 N 个行为人的非定向关系网络，当其中有 M 
个行为人没有关系客体报告时,某一具体关系的应答率的计 
算如下 所示： 


( =100% 当 M =0 或 M =1 


R < 


(】 -翁) 


X 100% 


当 1< M<AT 


1=0 当 M=N 


例如，在一个含有五个行为人的网络中，节点应答率和 
关系应答率依关系节点缺失数量的不同而有所变化，具体见 
下表： 


缺失节点数 

节点应答率 

关系应答率 

0 

100% 

100% 

1 

80% 

100% 

2 

60% 

90% 

3 

40% 

70% 

4 

20% 

40% 

5 

0 

0 


为了方便阐述，现假设网络行为人分别为 A 、 B 、 C 、 D 、 
E 。 在这五个行为人中的10种非定向对偶关系是 AB 、 AC 、 
AD 、 AE 、 BC 、 BD 、 BE 、 CD 、 CE 、 DE 0 假如行为人 A 没有 

报告他 / 她的关系，关于 A 的这些对偶节点依然能够从其他 
四个人的报告中获得。因此，尽管缺失了 1个节点的报告， 
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关系应答率仍然是100%。当节点缺失数量为2至 4( 1 < 

M<iV) 时，关系应答率是 (l-^|)xi00% o 比如，假如有 

3个节点 ( A 、 B 、 C ) 未报告他们与其他人的关系时，关系应答 

率为70% 〔<1 — jx 100 — 70% J 0 在这种情况下，三对 

非定向性关系缺失了 （ AB 、 AC 、 BC )， 但是其他七对关系仍 
然可以由其他剩下的人报告。假如没有任何行为人提供信 
息，则节点应答率和关系应答率都降为0。因为节点应答率 

的计算公式为 (1 —晋 )X 100, 而且努总是要大于吾 | 有 

关数学证明可以向本书作者索要），因此在节点缺失报告的 
每一个层级上，非定向关系网络的关系应答率总是会高于节 
点应答率。 

相反，缺失的节点信息对于定向网络的关系应答率具有 
重大影响。不对称性存在于多种网络关系中，例如提供建 
议、信任、喜爱。行为人 A 和行为 B 可以构成两种定向性关 
系: AB ， 表示 A 所报告的其与 B 的 关系; BA ， 表示 B 所报告的 
其与 A 的关系。因此，每一个节点的缺失，都会导致该节点所 
指向的所有关系信息的缺失。假定一个含有 N 个行为人的网 
络缺失了 M 个节点，那么该定向网络的关系应答 率为： 

100% 当 M =0 

)X100% 当 0<M<N 

当 M=N 

说明如 下:现 假定有一个五人的关系网络，它含有 （5 2 — 
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5) = 20种定向对偶关系: AB 、 BA 、 AC 、 CA 、 AD 、 DA 、 AE 、 
EA , BC . CB . BD , DB , BE , EB , CD . DC , CE , EC , DE 和 
ED 。 如果每个行为人都报告其与他人的关系，那我们就得到 
一个100%关系应答率。假如有一个点（比如 A ) 缺失，那么 
所有 A 的报告也会缺失,导致这20对关系有4对 ( AB 、 AC 、 
AD 、 AE ) 未报告，因此关系应答率就只有80%。在定向网络 
中的每一个点都必须评价与其他点的关系，因此 M 个缺失点 
(当0 < M < JV ) 将导致 MX ( N - l ) 个关系的缺失。当然，当 
没有一个点报告关系时 ( M = JV )， 节点应答率和关系应答率 
都等于0。 

利用一点代数推理，我们现在证明在定向网络中关系应 
答率总是等于节点应答率。假设我们有一个含 N 个节点 、 Af 

个缺失点的定向网络，那么节点应答率是而关系 


应答率为 （ 1 _ 


MX ( N -1) 


MX ( N - l ) 
2 X C % 


。具体来说， 


MX ( N - l ) 


2XCl 


N 


2 X 


N ! 


2 ! X ( N - 2 )l 


) 


MX ( N - l ) 
NX ( N - l ) 


g 。 因此，在有 5 个节点的定向网络中，当没有节点缺失时， 

节点应答率和关系应答率都是100%;当1个节点缺失时，这 
两种应答率都为80%;当2个节点缺失时，为60%;当3个节 
点缺失时，为40%;当4个节点缺失时，为20%；当所有节点 
都缺失时，为0。 

在前面的论述中，我们认为，在非定向网络中，对偶关系 
中的某个成员所进行的报告可以视为是对该对偶关系的可 
信测量。但学者一般都认为，这一观点必须谨慎采用，因为 



74 


社会网络分析(第二版 1 


经常发生单向关系 (Stork & Richards , 1992) 0 例如，在 一 个 
交流网络中， A 报告说与 B 进行交谈，但 B 报告说根本未与 
A 交流。这种矛盾对下列做法提出了质疑，即仅从未缺席方 
提供的信息，来构建行为应答方与行为缺席方的关系。斯托 
克和理查兹 (Stork & Richards , 1992) 建议，关系双方特征的 

相似性，比如他们的年龄、性别和教育背景等，可作为认定他 
们对偶关系的一个很好的指标。另外，网络信度——由双方 
关系成员共同描述的所有对偶关系的比例——表明了一个 
单独的报告是在何种程度上揭示调查应答者与未应答者之 
间的联系。当网络信度高，并且关系双方具有相同的或相似 
的个人特征时 ，一 方的报告可以作为他们关系的一个可信代 
表。科斯尼特 ( Kossinets ，2003) 赞同斯托克和理查兹的方 
法，即当调查未应答者数量很少时，可以根据应答者的报告 
来构建对偶关系网络。 

自我中心网络研究对数据缺失比较敏感，因为人们常常 
疏于描述关系客体间的联系。在研究1985年 GSS 讨论网络 
时，伯特 (1987) 的报告指出， GSS 自我中心网络研究中的数 
据缺失并不严重 :共有 1534个调查回应者，他们列举了 4483 
个讨论对象，其中只有66个应答者提供的网络数据不完整， 

涉及195个讨论对象。伯特比较了两种讨论对象-种 

具有全部网络关系数据，另一种则只有部分网络关系数据。 
他发现前者关系客体的35%都与其他关系客体关系不紧密， 
这正如调查应答者所报告的那样，而后者的这个值则升至 
59%。这其中主要的含义是，在一个自我中心关系网络中， 
关系客体间所缺失的关系一般都是弱关系。关系主体似乎 
更倾向于报告那些与其他关系客体存在联系的客体关系，而 
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不是那些看起来比较孤立的客体关系。这一发现也解释了 
与其他研究方法结论相反的一个现 象:受 过大学教育的 GSS 
调査回应者，相比教育程度较低的回应者，往往会提供更加 
不全面的自我中心网络关系数据。大学毕业生倾向于列举 
那些由许多弱联系的关系客体所构成的自我中心网络，反之 
也将不会更多地报告有关客体关系的数据缺失。 

由于没有万无一失的事后补救办法来解决数据缺失问 
题，因此这个问题的解决之道只能是让更多的调查对象了解 
参与的重要性 (Knoke Kuklinski ， 1982：35) 0 为了获得较 
高的参与程度，比如有些网络研究达到了 90%的应答率，研 
究人员常常要付出更多的辛苦，采取不同的说服技巧，比如 
个人书信、电话联络以及钱财激励等。数据缺失问题这一难 
题并非仅仅存在于使用调查方法进行的社会网络研究中，档 
案研究也容易受数据缺失的影响。一般人会想当然地认为， 
档案数据的完整性是受数据存储管理操作的影响的。然而， 
在某类数据的可得性不变的情况下，编码人员的能力与数据 
搜索软件的效率也同样能对获取信息的数量和质量产生重 
大影响。训练较差的编码员、设计糟糕的软件，都绝对会导 
致规模较大的数据缺失。 
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这一章我们将讨论社会网络分析的基本方法，对重要的 
传统论题和新近的发展也会给予同等的关注。其中，我们尤 
其着重论述密度、中心度、内聚、结构等价、聚类、多维度标 
度、块模型。由于网络数据描述总是在社会网络分析之前， 
因此这部分自然也就从描述两种独立但联系紧密的展示和 
分析社会网络数据的方法 开始: 图表和矩阵。图表展示的是 
社会网络的可视性，而矩阵则利用数学上的代数来描述网络 
关系。虽然社会网络学者可以自由地选择运用图表或矩阵 
模式来描述他们获得的数据，但是这两种方法各有优劣。图 
表可以为读者提供有关网络结构的更加直观的表述，但缺乏 
数学上的可操作性。与之对应的是，虽然矩阵看上去界面不 
够亲近读者，但他们非常便于对社会网络数据进行复杂的数 
学和计算机分析。网络分析者必须熟练运用这两种日常分 
析工具，以便对关系数据的重要特征进行概念化和测量。 



第 4 車网络分析基本方法 


第1节 I 图表 


雅克布 • 莫雷诺 (1934) 是社会计量方法的先驱，他重视 
建立社会关系图，即二维图，用于展现某一有界社会系统内 
行为人之间的关系，比如一个小学班级。点和线——社会关 
系图中的两个基本元素——也确定了图的基本构成，从而也 
从图论中引入了相关概念和定理 ( Harary ， 1969)。在社会关 
系图和图表中，行为人是由 N 个点(也称为节点或顶点)来代 
表的，常常用标识名、字母或数字来表示。两点之间划出的 
线(也称为弧或边），表示一种关系或 连接; 线的缺失，意味着 
两个行为人之间不存在直接关系。如果两点之间有一条线， 
那么这两点就是邻接的。如果某一个点是定义某条线的两 
点之中的一点，那么这个点就附属于这 条线; 反之亦然。在 
网络关系量表中,点的精确位置和线的长度是可以随意的， 
虽然某些版本要比另外的版本更清晰。建构一个富有洞察 
力的社会关系图，和进行一项科学活动一样，是一种艺术 
行为。 

假如一条线没有箭头，那么就表示这种关系是非定向性 
的或双向的(如同事关系）。假如关系是从一个行为人指向 
另一行为人，那结果就是一个定向图表或有向图。形式上， 
一个有向图是点的有限集合，也是有序配对 U ， W 的集合，其 
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中点 a 是线的起点，点6是线的终点。单向箭头表示一种定 
向关系，方向由箭尾的行为人指向箭头的行为人(如，提供建 
议)。双向箭头线条表示两个定向性联系，从每一个点到另 
一个点，表达的是一种互惠关系或相互关系(如，每个行为人 
都选择对方作为自己的“亲密朋友”)。一个替代模式是使用 
两个单向箭头，每个箭头都指向对方。一些社会关系图也通 
过线条粗细的变化，或者不同种类破折号的使用，以便更形 
象地表达双方关系的力度、密度或者频率。 

为了阐述一个社会网络结构的图表，我们利用了费尔德 
曼一萨维斯伯格等人 ( 2005 ) 对喀麦隆妇女同乡会组织的网 
络研究。为了便于分析集体记忆是如何影响妇女们对生育 
的讨论，费尔德曼一萨维斯伯格等人 (2005) 访谈了喀麦隆首 
都雅温德的六个妇女协会中的156个成员。他们的深度访 
谈涉及妇女社会网络的一些问题，比如“请根据下列标准对 
你和你所在协会的其他妇女的联系力度进行排序：（1)知己； 
(2) 朋友； (3) 认识； （4) 完全陌生”。由于每一个妇女仅被问 
及她与同一协会其他妇女的关系排序，因此对这六个协会都 
分别构建了独立的网络结构。为了简单阐述，我们选取了第 
六协会的网络结构，它有六个协会成员。 

图 4.1 表示第六协会成员间的社会关系图。线条的粗 
细表示三种层级的选择，没有连线表示两人之间完全陌生。 
在这六个成员间的23种定向关系中，只有15对关系中的4 
对是互相同意的(即两个妇女都选择了同样的层级） :妇女 1 
和妇女2互相视为知己，妇女3和妇女5是朋友，妇女2和妇 
女5仅仅认识，而妇女5和妇女6则完全陌生。其他11对则 
对她们的关系有不同的分级。例如，妇女6将妇女2视为知 
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己，但妇女2认为仅认识妇女6而已。虽然社会关系图可以 
提供一个直观的网络结构图，但是在展示由几十个甚至上百 
个行为人组成的大型网络方面,它们在视觉效果上就常显得 
很难看了。我们可以看出，仅仅六个行为人和23种定向关 
系，图表就显得非常复杂了。相比较而言，一个矩阵就可以 
轻而易举地表示几十个行为人的网络关系。 



一►知已一►朋友一认识 


图 4.1 喀麦 醱首都 雅温徳第六妇女同乡会的社会网络 

图 4. 2是一个包含七个虚拟行为人的有向图，表示的是 
提供建议的社会关系。通过这张图可以阐述几个基本的概 
念。子图，是指在一张大图中点和线的子集。汤姆 ( Tom )， 
贝蒂 ( Betty )， 简 ( Jane ) 三人组成的三角关系便是一个子图。 
行程是附属的点和线交替的过程，在这个过程中，每个节点 
附属于它前后的线。行程的长度是它所包含的线的数量。 
行程简一汤姆一贝蒂一哈里 （ Harry ) —迪克 （ Dick )— 萨莉 
( Sally ) 的长度是5。轨迹是由不同的线构成的行程，即使其 
中一些点也许被访问过不止一次，例如迪克一萨莉一哈里一 
汤姆一贝蒂一哈里一迪克便是一个长度为6的轨迹。 
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萨莉 哈里 a 姆 



图 4. 2由七个行为人组成的有向社会网络 

由于这个轨迹的起始和终止都在同一个点，因此它也被 
称为回路。沃瑟曼和浮士德 (1994: 107— 108) 讨论了封闭行 
程、旅程和回路等相关概念。 

在网络分析中，一个重要概念是路径。它被定义为一个 
经由完全不同的节点和线的行程，其中点和线只能经过一 
次。在有向图中 ，一 条路径必须经由不同的节点，而且其中 
的每条线都是由第一个节点到第二个节点。换句话说，所有 
的箭头都是朝着一个方向的。因此，贝蒂一哈 里一萨 莉不是 
一条路径，但贝蒂一哈里一迪克一萨莉是一条路径（见 
图 4. 2)。路径的长度(即其行程中所经线的条数)被称为径 
长。在两个点之间也许有好几条路径，但是最短的路径被称 
为测地线。从简到萨莉的两条路径中，测地线简一贝蒂一 
哈里一迪克一萨莉的径长为4,它短于另一条长度为5的路 
径(简一汤姆一贝蒂一哈里一迪克一萨莉）。那从迪克到汤 
姆的测地线是多少呢？ 

如果两个节点之间存在至少一条任何长度的路径，那么 
这两点就是可及的。汤姆对萨莉来说是可 及的; 虽然对萨莉 
来说，简是不可及的，但是对简来说萨莉是可及的。 

如果每对节点之间存在路径，那么这个图表就是连 
接状 态的； 但如果至少有一对节点之间没有路径，那这 
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个图标就是非连接状态的。如果一个点没有与任何其他 
点有线连接，那这个点就是孤立的。玛丽明显是孤立于其 
他六个人的，因此这个图也是处于非连接状态的。假如我 
们忽略玛丽，那剩余的六人关系图就展示了三个层次的 
连接： 

强 连接: 每两个点都由直接的路径双向连接(例如，从《 
到6并且还从6到 a ); 

单向连接 :每两 点之间都从一个方向(而非另外方向）由 
一条路径相 连接； 

弱 连接: 所有两点之间有连线，但不考虑其连接方向。 

很明显，这个六人的有向图只是个弱连接图。然而，在 
大网络之中的几个小网络子集的连接强度要比整个网络图 
强。图表组成部分是构成一个连接状态图表的极大化子图， 
而一个强连接图组成部分就是构成强连接图表的极大化子 
图。子图萨莉一哈里一汤姆一贝蒂是一个单项连接部分，因 
为不同长度的定向性路径单方向地连接了每一对点。这个 
组成部分是极大化的，因为一旦加入简，就将破坏这种单向 
联系。那为什么简一汤姆一贝蒂这一更小的子图不属于强 
连接部分或单向连接部分呢？ 

在一个连接图中，如果去除一个点，将导致该图不能连 
接(即会创建两个或多个组成部分），那这个点就是一个分 
界点。假如将哈里从图 4. 2中移除，那这个六点图就会分 
成两个小的组成部分(萨莉一迪克和汤姆一贝蒂一简）。同 
样的，如果去除一条线，会将一个图表分成两个或多个组成 
部分，那这条线就称为桥。请问这张图中包含桥么？为 
什么？ 
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相对于存在很多维持信息和资源流的多余路径的网络， 
有分界点和桥的网络更容易受到破坏。例如，恐怖基地的秘 
密网络有可能因为一个关键人物被抓或被杀而陷入瘫痪状 
态 （ Borgatti ， 2003； Tsvetovat &- Carley ， 2005)。 
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第2节 I 矩阵 


网络关系的代数形式可以表达社会关系图中所有的量 
化信息，和直观的图表形式相比，代数形式能够做更多的分 
析。可供数学分析的社会网络数据的最基本形式是列表，称 
为社会矩阵，也称为邻接矩阵，是一个由行和列所构成的数 
值方列阵。例如，大写黑体的表达式 X ( iV ， N ) 表示社会矩阵 
X ，它有 N 个行和列，而且其 iV 2 个单元表示 N 个社会行为 
人之间的各种关系。行为人的顺序或定位可以通过矩阵的 
行和列来一一对应，利用下标字母 f 和其值从1至 iV )， 相 
应表示特定的行列位置。大体上，一个单位格的值表示为 
Xy ;例如，: T 35 表示一个社会矩阵中第3行第5列的值。在绝 
大多数社会网络的实际运用中，矩阵主对角线（即 第〗 行第 Z 
列所组成的单位格)是没有意义的，例如，某个人不可能是他 
/她自己的好朋友，因此在数据分析中是可以被忽略的。因 
此，在一个含有 iV 个行为人的社会矩阵里，拥有唯一值的单 
元格的最大值是 iv 2 — N 。 

在一个社会矩阵单元格的数值测量矩阵中，特定的行和 
列对应一对行为人之间的特定关系。按照惯例，在定向关系 
中，行中的行为人属于起点或发送者，而列中的行为人属于 
终点或关系的接受者。最基本的测量就是关系的存在或缺 
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失，分别由1和0这两个二进制值表示。因此，二进制矩 
阵数巧=1表示行为人 Z 发送 了一个关系给行为人 h 如果 
=0, 则表示由 f 至 J 没有关系。由于在有向图中，关系并 
不局限于双向的或者互惠的性质，因此它们的矩阵图是不对 
称的。在非定向网络中，叫=:^，也就是说，起点/和终点 
3 之间的关系值总是等同于起点 j 和终点 f 之间的关系值。 
这种矩阵是对称的。 

社会矩阵也包含非二进制值，反映关系强度，比如联系 
的频率、关系的力度或者组织的大小。在这类赋值的图表 
中，单元格可以从0至对偶关系水平的极大值，或者包括小 
数甚至负数以表示反向关系，比如“不喜欢”或者“敌对”。 

表 4.1 给出了喀麦隆雅温德地区第六妇女同乡会的矩 
阵图。这个矩阵是图 4. 1的代数形式。由于每一位妇女都 
对与其他五位妇女的关系力度进行打分，并且在双方评价时 
会有差异，因此这个矩阵是賦值和不对称的。行中的妇女对 
与其他妇女的关系进行评价，而列中的妇女是被打分的对象 
(行和列中的标注并不是矩阵的一部分，但是可以作为参 
考)。例如，妇女1对与妇女3的关系力度评分为 2( 表示朋 

表 4. 1喀麦隆雅滠德地区第六妇女同乡会的社会网络矩阵 
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W 3 

W 4 
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3 
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1 

2 

0 

— 
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W 6 

0 

3 

0 

0 

0 

— 

注： 0 = 

完全陌生;1 

=认识;2 

=朋友;3 

=知己。 
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友关系），但是妇女3对她与妇女1的关系的评分只有 1( 表 
示认识)。图中的破折号表示主对角线上的值是没有意义 
的。表 4. 2是图 4. 2的一个二进制赋值矩阵。 


表 4. 2 7人有向社会网络(图 4.2) 的矩阵图 



萨莉 

哈里 

迪克 

汤姆 

贝蒂 

简 

玛丽 

萨莉 

—— 

1 

0 
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0 

0 

0 

哈里 

0 

—— 

1 

1 

0 

0 

0 

迪克 

1 

1 

—— 

0 

0 

0 

0 

汤姆 

0 

0 

0 

—— 

1 

0 

0 

贝蒂 

0 

1 

0 
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—— 

0 

0 

简 

0 

0 

0 

1 

1 

—— 

0 

玛丽 

0 

0 

0 

0 

0 

0 

—— 


有时，网络研究人员使用非正方形矩阵表示行为人特征 
或者他们对某一事件的参与。数学符号 Z ( N ， M ) 表示一个 
长方形矩阵 Z ， 其中 iV 是行为人的数量， M 是特征、事件或地 
址的数量。例如，弗里曼和韦伯斯特 (1994) 观察了 31天内 
43个沙滩常客，记录了与这些人有关的353个事件（比如野 
餐、游戏等)。他们建立了一个 43 X 353 的矩阵，其中第 f 行 
第 J 列的值为1，表示第 i 个人参与了事件）。如果研究人员 
收集了不止一种关系的网络数据，那么可以分开或综合构建 
并分析多个社会矩阵。表示 i ? 多元网络间具体关系的矩阵 
形式，只需要简单地多加个脚注，也就是: c 讲，表示在第是种 
关系中第 i 行和第 j 列的单元值。 
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第3节 | 关系的测置方法 


社会网络数据中的基本关系测量方法包括密度和中心 
度。在讨论它们之前，我们回顾几个网络数据的基本原则， 
它们在向度和赋值这两个维度上有所区别。向度将社会网 
络数据分为无向关系和有向关系两种。在无向关系数据中， 
一对关系的起点和终点(例如，发送者和接受者，选择者和被 
选者)是没有区别 的：如 果迪克娶了简，那简也同样嫁给了 
迪克。其他种类的无向连接包括某一组织内成员关系，某一 
社会事件的共同参与，以及互相交流知识等。为了获取无向 
关系资料，研究者常常只需要问一方知情者，然后利用这个 
应答即可了解这个对偶连接。相反，当对偶关系的每一方都 
向对方启动一种关系时，有向关系发生了，结果导致四种可 
能的二进制组合 :（1) A 给 B —些东西，比如信息、建议和钱 
等，但 B 不给 A ; (2) B 给 A ， 但 A 不给 B ; (3) A 和 B 之间互相 
交换; (4) A 和 B 之间没有交易。有向数据经常收集到这样 
的情 形:关 系主体的自我报告认为存在某种网络关系，但这 
种关系与关系客体对其看法不一致。许多也许在理论上可 
以被归为无向关系的网络数据，在实际中应当视为是有向连 
接数据来测量。例如，为评估一项信任关系的存在，研究人 
员应当问关系双方是否信任对方。研究人员不应首先假定 
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朋友关系是否总是互惠的，而应首先将他们视为是内在的有 
向 关系: Ted 也许视 Sally 为朋友，但 Sally 可不认为 Ted 是 
她的朋友。正如第3章所讲到的，许多的认知社会结构网络 
关系具有固有的有向性，因为它们是来自于行为人对主观信 
仰、态度或者关系认识的报告，而这些很可能是不同于关系 
客体的主观看法的。即使一个关系在理论上可以归为无向 
类，但研究者通常还是得选择谨慎一点的做法，即请关系双 
方都提出各自的报告。在随后的分析中，研究者可以利用弱 
标准 ( 比如只要一方报告认同，即认为关系存在），或强标准 
(要求双方都必须确认该关系）来整合这种不同。 一 旦采用 
这一观点，那么在数据收集上就能使得分析者在供替代的标 
准假设之下验证他们结果的稳健性。 

根据关系信息的可获得性，社会网络联系可以分为二进 
制的或赋值的量表。在二进制数据中，被试者只需要回应关 
系的存在(编码为 1) 或缺失（编码为0)。在赋值数据中，他 
们不但要表示关系的存在与否，还要对二者交往的强度或频 
率进行排序或量化。例如，青少年会被问及在去年与伙伴发 
生性关系的次数。因此，二进制网络数据只有两个值，0或 
1。但赋值关系数据则展示了一个有序的或连续的梯度，数 
值可以从0至极大的可能值，甚至可以涵盖小数或分数。 

将向度和值进行交叉列表，可以得到四种基本的社会网 
络数据类型•.二进制无向、二进制有向、赋值无向、赋值有向。 
二进制无向数据需要从受访者或知情人那里获得的信息最 
少。访谈者只需要询问一方即可确认关系的存在与否。赋 
值无向关系数据需要一方来量化双方的关系。二进制有向 
测量只需要双方提及关系的存在与否。但是赋值有向数据 
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需要最详尽的信息，即关于对偶关系重要性的两个报告。由 
于自我中心网络研究和全幅网络研究在它们的研究设计、抽 
样、数据分析及其解释等方面存在极大的差异，因此下面两 
个小节讨论适用于这四类网络数据的测量。 


自我中心网络的测量 

在自我中心网络研究中，知情人被要求报告与其有特别 
联系的关系客体。这种关系被明确表述在提供给被调查者 
的提名法则中。一个著名的例子就是美国综合社会调査， 
“讨论重要问题”的提名法，在第三部分有论述。没有独立的 
信息是从由1985年 GSS 被调査者所提名的任何关系客体那 
里收集的。这一小节主要集中介绍自我中心网络的密度和 
网络范围测量。 

' 密度是指测量自我中心网络中 iV 个客体之间互相联络 
的程度(忽略了关系主体 ego , 因为本来所有的客体都与之直 
接联系）。现假定这种关系是无向性的二进制(有/无)关系， 
那关系密度 ( D ) 就等于所报告的客体间对偶联系(用 L 表示) 
数除以此种关系的极大可 能数： 


财③ = ^ X ( JV -2)!° 雛，織±僻奸絲雜， 
并且客体间只报告了两种关系，由于 G 二- 2 j x ( 5 5 ! _ 2) , - 

(1 X 2 X 3 X 4 X 5) _ 120 _ 味水封•入闷攸站芊 

(1 X 2) X (1 X 2 X 3) _ 12 _ 10, 那么这 1 社衣网-各的关 
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系密度就是 D 




L 


0. 20或20%。 


C % 10 

如果一个自我中心网络的联系是根据有向二进制来测 
量的，那么密度计算公式 就为： 


D 


L 


2 XC? n 


上述两种密度计算公式的第一个区别是分母不同。在 
同一 N 值的社会网络中，有向连接数是无向连接数的两倍。 
第二个区别是分子不同。虽然两个公式的分子都是反映对 
偶联系的真实呈现数量，但后者必须检查两个关系方向。 
在二进制无向网络数据中，每对连接方只计算一次，但在 
二进制有向网络数据中，每对连接方被计算两次，因为关 
系主体要报告每个客体是否首先与所有其他客体方进行 
联系。 

接下来，假定网络数据是赋值的无向性关系，那么自我 
中心网络密度计算 如下： 





C % 


在这个公式中，分子表示各种关系的所有值的和。此分子除 
以 N 个行为人间可能发生的所有关系数，便得到关系密度 
值，反映了主体之客体间关系的平均力度。假设某一研究项 
目要求主体对其5个关系客体 ( A 、 B 、 C 、 D 和 E ) 进行排序， 
标准 如下: 无关系(0)、认识(1)、朋友（2)、密友（3)。假如主 
体将 A 视为 B 的密友，将 D 视为 E 的朋友，而其余人之间没 
有关系，那么密度=(2+3)/10 = 0.5,结果表明这个自我中 
心网络的10个关系呈现的平均力度或权重为 0. 5。 
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最后一种密度测量是关于赋值有向关系数据的，公式 如下: 

D = ^ Lw 
2XC% 

它的分子包括所呈现关系的所有赋值的总和，而分母则包括 
iV 个行为人所在网络的所有可能有向关系数量的最大值，这 
是同样规模网络无向关系数的两倍。 

* 二进制网络数据的密度测量值被限制在0和1之间，其 
中0表示关系客体间没有任何联系，1表示所有的客体间都 
存在直接互相联系。这种限制的存在是因为二进制网络密 
度的分子不可能大于分母。对于无向和有向二进制数据二 
者来说，双方实际关系的数量必然要小于或等于所有可能的 
对偶关系的最大数（当 L 仅表示关系的存在数量时 ， L < 
C 2 n ； 当 L 不仅考虑关系的存在，还考虑关系的方向时， L < 

2 XC ^)。 然而，对赋值的自我中心网络数据来说，密度能够 
超过 1. 00,因为对关系特征的赋值也许远远大于二进制数据 
的最大关系值1。 

网络范围在广义上被定义为一个行为人的网络与其他 
不同行为人的联系的程度。在实践中，研究者利用多种经验 
标准来测量网络范围，例如网络规模、密度和多样性 ( Camp ¬ 
bell ， Marsden & Hurlbert , 1986)。而且，自我中心网络多样 

性测量的是一个个体网络中客体社会特征异质的程度。依 
据客体特征的测量水平，自我中心网络密度可以通过连续变 
量的标准差来进行测量，或者通过分类变量(包括离散的或 
有序的)的定性变化指数来测量。 

当一个客体特征按照连续变量来测量时，标准差反映的 
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就是一个自我中心网络内特征的差异性。一般来说，对含有 
N 个客体的第 f 个主体，其中第）个客体的特征是一个连 
续变量，那么标准差 就是： 



(Xy ~ X ) 2 


所有主体标准差的平均值可以测量一个自我中心网络样本 
中特征的多样性。马斯登 (1987) 发现，1985年 GSS 调查所 
得客体教育年限的平均标准差只有 1. 37年，这意味着在美国 
人的核心讨论圈中讨论对象都倾向于拥有相似的教育水平。 

当客体特征是按照分类变量来测量时，那 IQ V 就是用来 
测量自我中心网络的多样性。通常，对含有 N 个客体的第 z _ 
个主体而言，其中所有客体都被分成 K 类离散的或有序的类 
别，那 IQV 等于： 


IQVi = 


1 - 

(X-D/K 


其中汾 是第类中客体的比例。 IQV 的标准值介于 0.00 
和 1. 00之间，其中 a 00表示所有的 iv 种情形都包含在一个 
类别之中，而 1. 00表示所有的客体都均勻分布在 K 个类别 
内。例如，假如某主体提名了 4个男性和1个女性作为关系 

客体，那性别构成 IQV 就是 1-[( Oj 上 2 益 0. A ) 2 ] ^0. 64； 

当某人提名3个男性和2个女性时，那得到的性别构成 IQV 
就是 0. 96。因此，后一自我中心网络展现了更大的性别多样 
性。所有关系主体的 IQV 均值构成了一个样本定性多样性 
的分类变量指数。利用这一方法，马斯登 (1987) 报告说美国 
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人自我中心网络的性别 IQV 是 0. 68,而种族 IQV 只有 0. 05。 
很明显，美国人的核心讨论圈在性别构成上要比在种族差异 
上均衡得多。 

全幅网络测量 

在自我中心网络研究中，一个中心个体通过列举与他/ 
她有特定关系的客体来构建其网络。除非从一个高密度社 
区抽样 一 其中关系主体和客体之间都联系紧密 (White 
Watkins, 2000)，否则某一个主体的关系客体极少与另一主 
体的关系客体有关系。因此，之前部分中讨论的密度测量是 
建立在互无联系的知情人所提出的关系客体的特征基础之 
上的。相反，在全幅网络研究中，研究人员设定一个网络边 
界，只关注在此范围内的行为人之间的联系。例如，克雷克 
哈德 (1987) 的研究关注某一组织内21位高级技术经理人。 
每一位都被要求确认是否从其他20位经理人那里获得过建 
议。利用全幅网络设计获得的数据，只由所选出的这些行为 
人的联结构成。通常，选定范围之外的行为人的联结是不会 
考虑的。因此，把任何一种自我中心网络密度测量法应用到 
全幅网络中只得到单个的值。 iV 个行为人的随机抽样，产生 
N 个自我中心网络密度值，因为每一个行为人的自我中心网 
络都不同于其他行为人。相反，全幅网络有一个群体的单个 
密度值，不论总体 iV 是多少。尽管在分析层次上有这种差 
异，但对于自我中心网络和全幅网络而言，这四种密度测量 
的计算公式都是相同的。 

除密度之外，可广泛适用于全幅网络的其他关系测量方 
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法还包括节点度、行程、轨迹、路径、回路、组成部分、测地距、 
直径、分界点、桥、树、同构子图等。本书无法做到对所有这些 
方法进行详尽阐述，相关资料可见沃瑟曼和浮士德（1994)。 
这里，我们讨论两个基本主题 :节点 度和测地线。这两种测量 
方法同样都可以用于全幅网络和自我中心网络。为方便讲 
解，我们以代表不同的网络数据类型的四个图标为例。 

节点度表示为 d ( Ni )， 是行为人 f (也就是节点)的所有关 
系数量，其中度指线的条数。在一个二进制无向图中，如 
图 4. 3所示，每一个行为人的节点度为 d(N A ) = 4, cKNb) = 
d ( Nc ) = d ( N D ) = d ( N E ) = 3. 该全幅网络的平均节点度，由 
所有行为人的节点度相加，再除以行为人总数，表示节点间的联 

结程度。对图43来说，平均节点度是 4 +- 3 -+|+^+j = 3.2 0 



然而对于有向图，研究者必须区分节点入度和节点出 
度。节点人度是一个行为人接受的从其他行为人方向所来 
的线的 数量; 节点出度是从一个行为人节点向其他行为人所 
发出的线的数量。图 4. 4是一个朋友提名网络，其中 A 提名 
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B 和 E 作为朋友，但并没有其他人将 A 作为朋友。因此 ， A 
的节点入度为0,但节点出度为2。虽然一个人的节点人度 
和出度会有差别，但全幅网络的平均节点入度和出度总是相 
等的，因为指向所有行为人的线条总数等于从所有行为人处 
发出的线条总数。在图 4. 4中，行为人 A 、 B 、 C 、 D 、 E 的节 
点人度分别为0、2、1、1、3,但它们的节点出度为2、1、1、 
2、1。每一套度数总和都是7,因此网络平均节点度数为 

| = 1.4 0 一些学者认为，一般意义上节点出度表示扩展程 

度，而节点入度代表接纳程度或者受欢迎程度 （Wasserman 
&* Faust , 1994:126)。根据这种有趣的观点， A 是一个开朗 
型的行为人——会选择他人作为朋友，但是他是一个在网络 
中最不受欢迎的人 . 相反， E 是最受欢迎的，但相对来说他 
是个内向型的人。 



DO - ►Oc 


图 4. 4二分有向图 

对于计算賦值图的节点度数，通过网络文献回顾可以得 
到些许启示。其中一个简化的解决办法，就是将赋值图中所 
有的非零值替换为1，然后釆用二进制图的处理办法。但是， 
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这一方法忽略了賦值图中有关联结力度的丰富信息。在此， 
我们推荐一个概括的办法，用于计算賦值的无向图的节点度 
数。这一方法将一个行为人所有线条的赋值加起来。然后， 
该賦值的无向图的平均节点度数就是所有赋值节点度数的 
总和除以行为人的总数。图 4. 5中 A 、 B 、 C 、 D 、 E 的节点度 
数分别为5、13、7、5、12。因此该图的平均节点度数是 

5 + 13 + 7 + 5 + 12 = & 4 。 我们承认，这一求和法在下述两 

种相反的情形之下，会产生较高的节点 度数: 行为人线条值 
低，但数量多;行为人线条数量少，但赋值高。例如，有一朋 
友关系网络，其中的线条赋值表示朋友关系节点的力度。第 
一种情形下 ，一 个人有许多关系浅的 朋友; 第二种情形下 ，一 
个人只有少许关系非常密切的朋友。概括方法为两种节点 
度数都提供了同样的高值，但是并不能将二者区分开来。 



图 4. 5賦值无向图 


解决这个难题的一个办法，我们称之为均值法，它将赋值 
的线条数量考虑进来，用某一行为人线条的賦值总数除以线条 
总数。 因此，均值法计算与行为人直接联系的线条的平均賦值。 
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这一解决办法可以区分前述段落中所论述的两种 情形。 

假定行为人 X 有5个关系浅的朋友，每个朋友关系賦值 
为1;行为人 Y 只有2个朋友，但每个朋友关系都髙賦值，分别 
为2和3。求和法得到同样的节点度数5。而均值法则各产生 

一个平均数，行为人 X 的节点平均数为 1 + 1 + 5 + --~ 1 = 

1，而 Y 的平均数为^ = 2. 5。 Y 的平均节点度高于 X 表 

明 Y 比 X 有着更为紧密的朋友关系。 

对賦值有向图的节点度数测量在使用节点人度或节点 
出度时，必须考虑关系的方向性。下表给出了利用求和法和 
均值法获得有5个关系节点的图 4. 6中节点人度和节点出 
度的结果。 



节点度 

A 

B 

C 

D 

E 

求和法 

节点入度 

0 

8 

1 

4 

12 


节点出度 

5 

5 

6 

5 

4 

均值法 

节点入度 

0 

4 

1 

4 

4 


节点出度 

2.5 

5 

6 

2.5 

4 



图 4. 6賦值有向图 
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对两种方法进行比较，可以发现几点有趣的现象。使用 
均值法，节点 B 、 D 、 E 有相同的节点入度，表明这三者同样 
受欢迎。相反，求和法则发现三个节点人度成较陡的层次区 
别，其中 E 最受欢迎， B 次之， D 位于最末。如图 4. 6所示，求 
和法显示 E 得到程度不等的最多提名，因此将 E 视为是最受 
欢迎的点。均值法强调，虽然 D 只得到一次提名，但是它有 
较髙的赋值，因此 D 的排名与 E 和 B —样。根据他们不同的 
研究目的，网络研究者可以选择不同的测量方法来测量有向 
賦值图的节点度，但必须谨慎解释他们的结果，解释的时候 
必须和求这些值的方式一致。 

测地距是两个行为人之间最短路径的长度。它的计算 
因全幅网络的四种类型不同而差别较大。让我们从最简单 
的例子开 始:图 4. 3的二进制无向图。节点 A 和 B 有许多条 
路径相连（例如， AB ， ACB , AEB , ADCB , ACDEB , AED - 
CB ), 路径长度从1至4。最短路径 ( AB ) 的长度为1，因此 A 
和 B 之间的测地距是1。图 4. 3包括10对关系= 

2|^3!二 10) 。这 10 对关系间的测地距，依两点之间是否有 

直接连接而距离不同。例如， AB 的测地距是1，而 CE 的测 
地距是 2( 通过 CDE ， CBE 或 CAE ) 。 

含有 iV 个行为人的有向图的双向连接数是同等规模的 
无向图的两倍，因为在有向图中，每对行为人有两个有方向 
的连接，而在无向图中则只有一对连接。例如，图 4.4 中 AB 
之间有两个有向关系: AB 和 BA 。 由 A 连至 B ， 有两个 路径: 
AB 和 AEDCB (但 AEB 并不是一条路径)。最短路径是 AB ， 
因此 AB 间的测地距是1。反过来， B 不能连接至 A ， 因此 BA 
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之间的测地距不明确。有向图的测地距分析，在网络研究中 
有许多实际的运用。其中一种情形，就是绘制一个行为人群 
体之间的交流图。假定图 4. 4表现了一个五人间的交流网 
络， A 可以直接向 B 发送信息，或者通过 E 、 D 、 C 向 B 间接 
地发送信息。但是通过中介传送信息容易延误或者歪曲，因 
此正如 AB 间的测地距所分析的那样， A 最有可能直接与 B 
交流。相反， B 既不能直接也不能间接地向 A 发送信息。实 
际上， A 只能充当一个信息发送者，而不能作为一个信息接 
收者，因为没有人与 A 交流。这个例子生动地描述了信息的 
流动并非是互惠的。 

当考虑每一条路径的赋值时，计算賦值有向图的测地距 
会面临一些困难。我们可以将赋值图简化成二进制图，然后 
运用二进制图处理程序，但因此也浪费了这些赋值所提供的 
丰富信息。杨和诺克 (2001) 提出了一个解决之 道:利 用路径 
长度和路径值来测量赋值图双方的测地距。这一方法通过 
一个合适的运算法则来实行 (Yang & Hexmoor , 2004)。大 
体上，这个方法涵盖:（1)找出所有的连接 路径; （2) 找出每一 
条路径的最 小值; （3) 用最小值除以每一条路径的 长度； （4) 
在第三步的结果中挑选出最高的值，这便是一个赋值图的测 
地距(也称为最佳连接， Yang & Knoke , 2001)。这个方法假 
定，长的路径最容易受到延迟和扭曲，而最短的路径对于双 
向交流来说等同于瓶颈路段。在图 4.5 中，连接 A 和 B 有三 

条路径，他们的平均路径 值为： AB = 2, AEB = | = 1.5, 

AEDCB = j = 0. 25。选择最高的平均路径值，那 A 和 B 之 
间的测地距为2，因此最佳路径就是 AB 。 
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杨和诺克 (2001) 的方法可以运用于賦值有向图中两点 
间的测地距的计算，不过关系的方向必须被考虑其中。 
图 4. 6连接 A 到 B 的两条路径是 AB 和 AEDCB ， 其中 AB 平 
均路径值是2, AEDCB 的平均路径值是0.25。选择最大的 
路径值，那 AB 间的测地距就是2。然而，连接 BA 间的测地 
距是无法确定的，因为 B 无法通过任何路径到达 A 。 

节点度和测地距是社会网络分析的重要测量方法。节 
点度比较容易计算，并且常能为实际运用提供大量信息。节 
点度一般表示一个行为人参与网络行为的程度。例如，朋友 
关系网络中的节点度低，表示该行为人朋友较少。对全幅网 
络而言，平均节点度表示行为的综合水平。例如 ，一 个社区 
住户间串门的平均节点度较低，意味着邻居间活动少。节点 
度也是节点度中心度测量的一个基础，这个在下文中将要讨 
论到。两节点间的测地距是节点之间关系亲密度非常重要 
的标准。由于每对行为人间都有几条路径相连，因此测地距 
就是每两节点间的最短路径，也是基于距离的综合法的基 
础，例如多维标度和多层聚类分析，这些在本节的后面将会 
进行讨论。 
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第4节 | 中心度和声望 


图论在社会网络分析中的一个主要作用是，在个人分析 
层次和群体分析层次上，找出其中重要的或突出的行为人。 
中心度和声望的概念及测量通过综合所有点之间的结构关 
系，试图将图论关于全幅网络中行为人知名度的理念进行量 
化。对知名度的分析，将考量社会计量学上的选择与被选 
择，有时也包括间接关系的结构。个人行为人的知名度反映 
了他/她在其他行为人当中较为明显的可见性。群体层次上 
的中心度和声望指数，评估所有行为人的知名度在一个网络 
中的分散程度或不平衡程度。在本部分中，我们讨论两个有 
关知名度测量标准的大致分类: （ 1 ) 中心度，无论是作为关系 
的发起者还是接受者，当一个行为人知名度较高时，他/她对 
多种关系的参与程度较高; （2) 声望，表示知名行为人虽然只 
发起较少的关系，但是接受很多直接关系。知名度测量的选 
择，取决于概念化的运用和可得网络数据的类型。它们的计 
算要求运用前面几节讨论的矩阵数学概念。现在我们从最 
简单的例子开始，先讨论无向图，接着再讨论有向图。由于 
绝大多数知名度指标只要求二进制联系测量，因此我们的讨 
论就限于这类数据，但是我们鼓励网络研究学者致力于建立 
赋值图的知名度测量方法。 
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最广泛使用的中心度测量标准是程度、亲密性和中间性 
( Freeman , 1977、 1979)。这些测量在运用于无向关系和有 
向关系时有所区别，在运用于个体行为人和群体或全幅网络 
层次时也有所区别。下面的计算公式利用了沃瑟曼和浮士 
德 (1994) 的表示方法。 

程度中心度 

在无向二进制图中，行为人程度中心度测量社会网络中 
一个节点与所有其他节点相联系的程度。对于一个拥有 g 
个行为人的无向图，行为人；的程度中心度是 i 与其他 g — l 
个其他行为人的直接联系总数，用矩阵表示 如下： 

Co(Ni) = ^Xij (i ^ j) [4.1] 

/-i 

其中 C D ( N t ) 表示节点 f 的程度中心度，用于计算 

/ =i 

节点 i 与其他 g — 1个 j 节点 （ i 和， 排除 z 与自身的 联系； 

也就是说，主对角线的值可以忽略）之间的直接联系的数 
量。 C D (况）的计算就是简单地将行为人 i 在社会关系矩 
阵中对应的行或列所在的单元格值加总（因为无向关系 
构成一个对称性数据矩阵，因此行和列相同的单元格的值 
相同）。 

如此测量的行为人程度中心度，不仅反映了每个节点与 
其他节点的关联性，而且也视网络规模 ( g ) 而定。也就是说， 

网络规模越大，程度中心度的最大可能值就越高。因此，一 
项具体的程度中心度值可表示一个小网络内行为人的关系 
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紧密，也可以表示在一个大网络内行为人只与不多的几个人 
联系。为了消除网络规模变化对程度中心度的影响，沃瑟曼 
和浮士德 (1994:179) 提出了一个标准化的测量 公式： 

Cd ( M ) = Cd(N ^ [4. 2] 

茗 一 1 

这个标准化行为人程度中心度测量，使用行为人£的程度中 
心度值除以与其他 g — 1个行为人最大可能连接数，得到与 
行为人 i 有直接联系的网络成员的比例。 

这个比例从 0. 0到 1. 0, 0. 0表示与任何行为人都没有 
联系(例如一个孤点）， 1. 0表示与每一个人都有直接联系。 
标准化的行为人程度中心度测量行为人在诸多关系中的参 
与程度。得到高分的行为人是网络中最显眼的参与者。尤 
其是，标准化程度中心度值越接近 1. 00,那么行为人在关系 
网络中的参与度越高。假如研究者更看重行为的纯粹数量 
而不是无向关系的具体来源和目标的话，那么他们很容易将 
中心度这一概念运用于信息网络的获取、控制和居间行为的 
分析 （Knoke Burt , 1983)。 

与行为人的程度中心度不同，组程度中心度测量一个社 
会网络中的行为人与其他行为人在个人程度中心度方面的 
不同程度。组程度中心度非常接近描述统计学的离差测量， 
例如标准差，表示围绕中心趋势值变化或扩散的量。弗里曼 
(1979) 提出了组程度中心度的通用测量 方法： 

i ； [CA(iV*) —Ca(M)] 

Ca = - [4. 3] 

maxXJ[C A (N # )-CA(N,)] 
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其中， C A ( iV *) 表示网络中所观察到的行为人程度中心度的 
最大值，而 Ca ( N : ) 是 g —1个其他行为人的程度中心度。因 
此，分子是行为人最大中心度与其他所有人的中心度之差的 
总和。分母是这些差值之和的最大理论可能值。 

按照弗里曼的通用测量方法，沃瑟曼和浮士德 （1994: 
180) 在他们的组程度中心度指数中提出了有关分母的处理 
方法： 


2[Cd(N*) —CdWJ] 

Cd= ( g - l )( g -2) [ 4 . 4] 

分子表示最大中心度的行为人与其他节点之间的程度中心 
度所观测到的差值之和，分母测量差值的最大可能总和。这 
个值可能发生在星形图中，其中一个节点与其他所有节点相 
连，但其他所有节点都只与第一个节点相连。因此第一个节 
点具有最髙的可能程度中心度为 （ g — 1)，然而其他每个节 
点的程度中心度都等于1，两者之间中心度的差值就是 ( g ~ 
1) — l = g —2。 因为这个差值在该图中发生 Q —1) 次，因此 
分母值为 （g — l )( g — 2)。组程度中心度指数值在 0. 0至 1. 0 
之间。当社会网络的程度中心度均匀分布时，即每一个点都 

具有相同的程度中心度时， i [ C D ( N *)— C D ( Ni )] 等于 

1 = 1 

0;因此，组程度中心度为0。在另一极端情形下，当一个节点 
具有最髙可能的中心度 ( g ~ l ) 9 而其他所有节点的程度中 
心度为1时，表示最大的不均匀分布。分子等于分母，组程 
度中心度指数为 1. 0。因此，组程度中心度越接近 1. 0,社会 
网络中节点的程度中心度就越不均勻或越呈等级分化状。 
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亲密中心度 

行为人亲密中心度是用于反映在一个社会网络中某一 
节点与其他节点之间的接近程度 ( Sabidussi ， 1966)。亲密和 
距离指一个行为人能多快与他人联系上，例如通过直接交流 
或者极少的中间环节。行为人的亲密中心度是它与其他点 
之间测地距的函数(如前所述，测地距是连接两节点间的最 
短路径长度)。行为人亲密中心度指数为行为人；与 g — 1个 
其他行为人之间测地距总和的 倒数： 

Cc(Ni) = - ------- [4. 5] 

[J>(N,+ ， Nj)~ 

j=\ 

这个测量值不可能为 0. 0,因为在数学中0是不可能做分母 
的。因此，孤点(从节点 i 至该节点的距离是不可测的）亲密 
中心度值是不可能测量的，该指数只能用于可形成连接图的 
节点。对于实证社会网络分析来说，这一限制要求每一个行 
为人在网络连接图中至少要与其他一个成员存在连接关系。 
极低的行为人亲密中心度值，或中心行为人与其他人之间的 
高距离值，一般是因为该行为人处于一个较大的网络之中， 
或该行为人处于一个小网络中，但与该网络中的其他行为人 
有相对较长的距离值。 

当某一行为人与所有其他人关系亲密时，即在网络中与 
每个人都有直接联系时 ， Cb = l /( g —1)，该值随网络规模 
大小发生变化。 

为了控制网络规模便于不同网络间行为人的比较，比彻 
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姆 ( Beauchamp ，1965) 建议，通过乘以 （ g _ l ) 来标准化行为 
人亲密中心度 指数： 

Cc ( Ni ) = ( g - lXCc ( Ni )) [4. 6] 

为了比较和对比亲密中心度与标准化亲密中心度指数， 
我们参考两个例子。图 4. 7展示了一个3节点网络结构图， 
其中节点 A 直接与节点 B 相连，测地距为1;间接与节点 C 
连接，测地距为2。因此，图 4. 7中节点 A 的亲密中心度是 
1/(1+ 2) = 1/3。 

A© 


❹ B 


C ❻ 

图 4.7 3节点无向网络 图 4.8 4节点完全连接网络 

图 4. 8展示了一个4节点网络结构图，其中所有点之间 
都有直接连接。行为人 A 与 B 、 C 、 D 都有直接联系，测地距 
均为1。因此，行为人 A 的亲密中心度值为1/(1 + 1 + 1)= 
1/3。虽然图 4. 8中的行为人 A 与其他关系人的直接联系要 
比图 4. 7中的行为人 A 更多，但二者的亲密度值是一样的， 
因为第二个网络更大。为便于比较，标准化亲密中心度将网 
络规模考虑其中，对这两种情形进行了区分。图 4. 7的行为 
人 A 的标准化亲密中心度值为 （3—1)(1/3) == 0.67,而图 
4.8 的行为人 A 的标准化值更高一点，等于 （4 _ 1) (1/3) = 



A 
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1. 0。 行为人的亲密中心度值越髙，那么它与其他行为人的关 
系越紧密，从某种意义上来说，就是该行为人可以通过较短 
的测地距通达其他所有的节点。 

与组程度中心度相似，组亲密中心度也是一种离差测 
量，表示在一个网络内亲密中心度的等级分层。具体来讲， 
组亲密性中心度测量一个给定网络内行为人各自亲密中心 
度之间的差异程度。根据弗里曼 (1979) 的文献，组亲密中心 
度指数的计算公式 如下： 

|][Cc(N # )-Cc(Ni)] 

Cc = [( g -2)(^- l )]/(2^-3) [4 * 7] 

其中 Cc ( N * )表示网络中可观测到的行为人亲密中心度的 
最大值，而是1个其他行为人的亲密中心度。当 
一个网络中行为人的亲密中心度分布极其不均时，组亲密中 
心度达到最大值，为 1. 0。此时，某一行为人具有最大的亲密 
中心度，而其他所有人只有最低的亲密中心度。相反，如果 
每一个行为人都有相同的亲密中心度，那组亲密中心度等 
于0。 

中间性中心度 


中心度的中间性这一概念关注其他行为人如何控制或 
者调整并不直接连接的两节点间的关系。行为人中间性中 
心度测算其他行为人在何种程度上依赖网络中两节点间的 
测地距(即最短距离）。中间性中心度是一个非常重要的在 
一个网络控制信息交流或资源流动的指标。假设行为人 j 
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必须通过行为人〗才能与行为人々沟通，因此行为人〗负责 
或控制行为人 j 与々之间所传递信息的内容及时间。行为人 
/在众多对偶关系点间的测地距路径中出现的次数越多，行 
为人 〖控制 网络交流的可能性就越高。 

为了量化行为人 i 的中间性中心度，弗里曼 （1977) 提出 
下列处理步骤。首先，是点 j 和々间测地距的路径数量， 
如 （ M ) 是点）和是之间所有经过点 f 的测地距路径的数量。 
然后，将似（凡）除以砂，便得到连接点 J 和是的所有经过 
点；的测地距路径的比例。将所有不包括点 〖的对 点加起 
来，便是测算节点〖在其他网络成员间测地距路径的位置程 
度。下面的公式反映了这个 逻辑： 

Cb ( Ni) = ^^^ [4.8] 

j<k Sjk 

当 1 个节点间所有对点的测地路径都不经过点〖时, 
该中间性中心度值为 0. 0。假设每一对点只有一条测地路径， 
当 节点〗 经由所有对点的每一条测地路径时，该值即达到最大 

值 （ g — l )( g —2)/2 ( 除节点 i 之外， g —1个节点之间的所有 

*1 地距路径数童是6 = 2 Tf^T = 

( g - lKg -2)^ 。然而，假如每对点有不止一条测地距 (最 
短路径）时，节点 i 的中间性中心度的最大可能值将超过 
(g ^ D 2 (g ~ 2) ，具体值依每对点间的测地距路径的数量 
而定。 

沃瑟曼和浮士德 ( 1994； 190) 通过 Cb ( n t ) 除以 
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(§- l )( g -2 ) 的理论极大值来得到标准化行为人中间性 

中心度(当然，还是假定每对节点间只有一条测地距 
路径），其公 式为： 


CB(Ni) 


C B (Ni)X2 

(g — l)(g — 2) 


[4. 9] 


当初始中间性中心度是 0 时，标准化行为人中间性中心 
度值也是 0.0; 当其他 g —1 个节点中每对节点间的测地距路 
径都含节点 f 时，标准化行为人中间性中心度是 1. 0。因此， 
该值越接近 1. 0,节点 f 就越能控制或调解网络关系。 

如同组程度和亲密中心度测量一样，组中间性中心度测 
量该值在网络中不同行为人间的变化程度。按照弗里曼 
(1979) 的基本测算方法，沃瑟曼和浮士德 (1994) 提出了组中 
间性中心度指数： 


CB = ^( g -VH g -2^/2 [ 4 . 10 ] 

分子是最高值行为人和每个其他行为人的中间性中 
心度值的差异总和。分母表示网络中所有节点的中间性 
中心度理论上的最大可能值。行为人中间性中心度在 

( g - lKg .- g ) 时获得理论最大值。在群体层次，如果某一 

主要节点居间促成了所有其他的测地线，那这个最大值至少 
发生 g — 1次。因此，对于一个含有 g 个行为人的网络，其理 

论最大中间性中心度值是(这里我们再次 


强调，这个计算假定每一对点只有一条测地距路径。如果两 
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点之间存在多条测地距路径，那么行为人中间性中心度的最 
大可能值将大于 2) ，这将导致理论最大可能值 
的相应变化。） 

当所有的测地线都经由某一主要节点时，组间中心度 
为1.0。相反，如果在一网络中每一个节点都有相同的中间 
性中心度，那么分子为0,组层次中心度也为0.0。因此，中 
间性中心度越接近 1. 0,网络内中间性中心度越是不均衡 
分布。 


声望 

许多情况下，社会网络数据收集包括指导如何在调查中 
确定网络关系的发起人或发送人和终结者或接收者。在这 
样的有向图中，仅仅参与或融入某一关系，要比区分这一关 
系的发起者和接收者次要得多。例如，在一个工作场所的报 
告关系网络中，低阶位的员工通常向他们的管理监督者报告 
他们的工作行为和绩效工资绩点，而高层雇员很少或根本就 
不用对他们的下属报告工作。在一个朋友关系网络中，一个 
热情地将许多人视为好朋友的人，可能没有人将他视为 
好友。 

我们将声望定义为一个网络中的一个社会行为人接收 
他人所发出的关系或被他人视为关系客体的程度。这种发 
送者一接收者或源头一目标的区别，极大地强调了对资源控 
制上的不平等，以及伴随这种不平等而来的权威和服从 
(Knoke Burt, 1983:199 )。 
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根据这个定义，声望可以简单地通过计算某一个行为人 
接收其他行为人某种特定关系的有向连接数量来测量。例 
如，罗曼和诺克 (1987:163) 询问美国能源和健康政策领域的 
知情人士，请他们确认“对制定国家能源/健康政策具有特别 
的影响力和重要性”的机构名单。每一个提名都得到平等对 
待，没有将其来源进行区别对待，这样所获提名便反映了一 
个行为人在系统内的受欢迎程度。沃瑟曼和浮士德 (1994: 
202) 指出，行为人程度声望可以根据有向图的节点入度来 
计算： 


Po(Ni) = ^xji [4.11] 

卜 1 

因为这一测量加总由 g 个节点所组成的非对称社会矩 
阵中的第列的值，因此它的最小值是 0. 0,最大值是 g — 1。 
一个标准化的行为人程度声望，是控制了网络规模的大小， 
可以对不同网络进行声望 比较： 

g 

Pb ( Ni ) [4.12] 

当所有其他行为人都提名行为人；时，标准声望值为 1. 
0;当无人提名行为人 i 时，标准声望值为0.0。因此，这一比 
例越接近 1. 0,行为人的声望越髙。 

上述段落中所介绍的中心度、组中心度和声望的基本测 
量方法，都是基于二进制数据的。除了弗里曼、博加蒂和怀 
特 ( Freeman，Borgatti White , 1991) 讨论的賦值图中的中 

心度问题之外，对賦值图的相关测量研究极少。很显然，对 
于赋值图的中心度和声望测量问题，需要更多的研究。 
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自我中心网络中心度 

中心度和声望的分析局限于全幅网络数据，直到 Mars - 
den (2002) 将中心度的测量延伸至自我中心网络数据。他讨 
论了一个单一关系的二进制对称数据的中心度测量。在使 
用调査对象进行的自我中心网络研究中，关系主体提名 g 个 
与他有特定关系的客体。每一个关系主体〗产生一个 Q + 
1) X (^+1) 的数据矩阵，它的行和列都由关系客体1至 g 
加上主体 z 构 成。因为在定义中，主体与所有其他的客体 
具有直接联系，因此第 i 行中的每一个单元是= 1，其中 
而且关夂 

在一个全幅网络中，行为人程度中心度是行为人与他人 
的直接联系(参见公式4.1)。在含有 g 个关系客体的自我中 
心网络中，关系主体；的程度中心度是行为人程度中心度的 
最大可能值 g — 1。关系主体〗的标准化程度中心度总是 

= 1.0。 全幅网络中的行为人亲密中心度，是行为人 

茗 — 1 

与其他行为人之间测地距总和的倒数(参见公式 4. 5)。标准 
化亲密中心度控制了网络规模(参见公式 4. 6)。因此，行为 

主体的亲密中心度和标准化亲密中心度分别为+和 

g—l 

^Y = 1.0 o 最后，全幅网络中的中间性中心度测量节点 f 

经过所有对点间测地距的位置程度(参见公式 4. 8)。由于行 
为主体 f 在其自身的自我中心网络中与所有的行为客体直接 
连接，因此/可以作为每对并不直接相连的客体间的中并点。 
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马斯登 (2002:410) 宣称，在自我中心网络中，节点 f 的中 
间性中心度的测量不同于全幅网络。一方面，在自我中心网 
络中，节点 i 的中间性中心度会偏小。自我中心中间性测量 
不包括主体节点 z 的中间位置，这中间位置是任何一对经由 
超过三个路径长或更长的测地距的节点！ t 间的位置，但是在 
全幅网络的中间性测量中则包括这种情形。另一方面，当两 
个客体节点的连接不但可以经由节点 i 连接，而且还经由节 
点 f 所处自我中心网络之外的其他节点时，自我中心网络中 
间性中心度会夸大主体节点 f 的中间性中心度。在这种情况 
下，自我中心网络中间性测量会忽略此网络之外的中间节 
点，而全幅网络中间性中心度测量则会包括这种中间节点。 

关于这些观点的描述，请参见图 4. 9 。 行为主体 f 的自 
我中心网络由在某种关系下提名的关系客体 A 、 B 、 C 、 D 组 
成。全幅网络也包括节点 M ， 它连接节点 f 的两个客体 (A 
和 D )， 虽然 M 本身并不是节点 f 自我中心网络的一部分。 
节点 i 的四个关系客体构成六对关系 （ AB 、 AC 、 AD 、 BC 、 
BD 、 CD ) ，其中每一对都有一条独特的测地距路径。由于只 
有 BC 是直接相连的，而其余每对关系的测地距路径都包含 
主体点£，因此 f 的中间性中心度在自我中心网络中是5/6。然 
而节点 M 的出现，使得节点；的自我中心网络中间性中心度 



图 4. 9自我中心网络的中间性中心度 



第 4 章网络分析基本方法 


115 


和全幅网络中间性中心度之间产生了差别。一方面，节点 i 
自我中心网络中间性测量偏小，这是由于忽略了节点〗在两 
条测地距(对点 MB 和 MC ) 中的媒介位置。另一方面，由于 
忽略了 AD 间的测地距通过点 M 的情形(这与通过节点 f 的 
AD 间测地距形成了竞争），节点 f 的自我中心_络中间性值 
又会偏大。 

尽管在自我中心网络和全幅网络中间性的测量中存在 
这些差异，但马斯登 (2002) 通过分析17个实证网络发现这 
两种测量方法相差不大。因此，当全幅网络中相关数据难以 
获得时，自我中心网络中间性中心度似乎可以作为全幅网络 
的行为人中间性中心度的可靠替代。马斯登 (2002) 认为，自 
我中心网络和全幅网络中间性结果的差异也许是由于两种 
网络数据收集的不同造成的，而这是一个值得进一步系统性 
研究的重要课题。 
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第5节 | 小团体 


内聚力与一个社会群体或封闭社会关系圈中的亲密程 
度的概念密切相关。内聚型亚群体由通过多种直接互惠的 
选择关系相连的行为人构成。他们之间能够共享信息，团结 
互助，一致行动。所有的亚群体成员间有多种直接联系，很 
少或几乎不包含外来者，倾向于构成一个在思想、认同和行 
为方面具有同质性的群体。内聚型亚群体的例子包括异教 
组织、恐怖活动小组、犯罪帮派、军事行动小组、运动团队、手 
工行业和工作团队等。“小团体”已经进入了日常语言之中， 
主要指学校、教会和俱乐部这样的高层群体。这个术语在社 
会网络分析中具有特定含义，源于诸如节点、线和路径长度 
这些图论要素。利用小团体的概念来分析研究群体结构，可 
以帮助研究人员更好地理解内聚力是如何通过提供建议和 
利益支持来帮助群体成员的 (Dunbar & Spoor ， 1995)，更好 

地理解对小团体的广泛信赖是如何限制网络联系的范围的 
( Blau，Ruan &- Ardelt , 1991)。 

^社会学的概念，诸如组、群、圈子、帮派、派系、小团体等 
并没有严格的区别，可以互换 （ Borgatti，Everett Shirey , 
1990)。在对社会网络研究中大量关于亚群体的文献进行总 
结后，沃瑟曼和浮士德 (1994:251) 分析出了关于内聚型亚群 
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体的四个普遍 特征: 连接的相互性、亚群体成员间的可联络 
性、成员间联系的频率，以及与圈内成员间相对于与非圈内 


成员间联系的相对频率。这些特征是定义小团体和网络亚 
群体相关测量的基础。 


小团体 


一个小团体是含有3个或多个节点的最大完全子图，其 
中所有的节点都互相直接连接，网络中的其他点都没有与小 
团体中的每一个成员有直接联系。因此，在一个小团体中， 
每对节点间的测地距都是 1. 0。也就是说，每两个节点间都 
由一条直接路径相连。图 4. 10描述了一个含有6个节点的 
二进制无向性网络中的小团体。两个小团体 ABE 和 BCDE ， 
每一个都符合必要条件。虽然 F 与 A 和 C 都有连接，但这3 
个点并没有构成一个小团体，因为 A 和 C 没有直接联系。4 
个其他的小群体 ( EBC ， EBD ， BCD , BDE ) 也不是小团体，因 
为另外还有其他的点与这些小组别的所有三个点直接连接。 
例如， EBC 并不是一个小团体，因为点 D 与 E 、 B 、 C 直接相 
连。只有 BCDE 这个最大的完全子图符合小团体的条件。 
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作为识别内聚型亚群体的一个方法，小团体确认规则有 
着非常严格的条件。小团体概念有一个“吝啬鬼”的名声 
( Alba ，1973) ，这是因为仅仅某一条线的缺失也许就会让一 
个子图不能成为一个小团体。因为小团体构成的高门槛，实 
证研究者极少在低密度的实际网络中发现大的小团体 ( Was - 
serman Faust , 1994:256)。在实际网络数据中很少发现 
小团体的原因之一在于网络数据收集的设计。例如，固定名 
单法可能会限制受访者提名的关系客体的最大数量(如“说 
出你的三个最好的朋友”)。因此，小团体的规模不可能超过 
研究人员设定的上限。 

小团体标准也严格地将内聚型亚群体内成员与群体外 
成员区别开来，因此忽略了更核心的和更边缘的行为人之间 
的等级层次。一旦小团体的边界划定了，在小团体和非小团 
体成员间的区分就很难更为精细了。如此简单的一分为二 
法则常常是不够的，因为它不能反映更为重要而微妙的差 
别。一个图中小团体数量的决定因素之一是全幅网络的规 
模。小规模网络极少形成小团体，而大规模数据库常常产生 
大量的微小团体，而且它们还常常互相重叠。这一限制导致 
研究者集中在多重重叠的小团体，而不去搜寻一个单一的独 
立小团体。 


小团体 

虽然严格的小团体定义使得它拥有的信息量有限，但是 
它紧接着也催生了有关亚群体内聚力的测量，从而在一定程 
度上缓解了小团体构成方面的严格要求带来的压力。一个 
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通常的方法就是基于节点度数，即通过某点的线条的数量 
(Doreian Woodard, 1994; Seidman, 1983)。我们在第3 

章论述6中心概念时讨论过这个方法。这一方法将々中心定 
义为一个亚群体，条件是每一个群体成员至少与6个其他点 
直接连接。通过改变々值，研究者能够为定义一个亚群体的 
边界设定一个严格或宽松的标准。 

第二个通常的方法是利用节点连接来修正小团体 
(Alba, 1973； Mokken, 1979)** w ■小团 体概念放宽了小团体 

本身的严格条件，即每对节点间的测地距值必须是1.0。在 
„-小团体中，所有对点间的最大测地距是路径长度 n; 也就是 
说，没有节点离其他每个节点的距离超过 n 个连接。通过改 
变 n 的值，网络研究者可以区分具有更强凝聚力的亚群体 U 
小)或者更弱凝聚力的亚群体 (n 大)。例如，设定 n 值等于2， 
即等于一个作为有3节点或多节点的子集的2-小团体，其所 
有的测地距是2或 更小; 而网络的其他所有节点都与2-小团 
体连接，其测地距是3或大于3。在无向图(图 4.10) 中，节点 
F 在严格标准下不属于任何一个小团体。 

然而，将测地距从1放宽至2,即可得到一个包含节点 F 
的2-小团体(整个图为 ABCDEF)， 因为该节点（同时节点 A) 
连接2-小团体的所有成员，而其中的测地距等于或小于2。 
^小团体标准具体 化为: 任何对点间的最大测地距不能超过 
n 0 一般来说， n 的值越大， Tz- 小团体的包容性也就越强，因此 
其成员间的凝聚力也就越弱，因为一些对象之间距离要达到 
n 步。严格定义的小团体是 n •小团体的一个特例，其 n 值等 
于 1. 0。 
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有向图中的小团体 


有向图将关系的发送者和接收者区别开来。在有向图 
中识别小团体需要注意对偶连接关系的互惠性。为拓展无 
向图中小团体的严格定义，我们将有向图小团体定义为由等 
于或大于3个节点构成的子图，其中所有的每一个节点都直 
接与其他节点连接，而且每对点之间都是对接的（即对偶连 
接)。为了描述有向图的小团体，图 4. 11展示了一个由6个 
节点组成的有向连接网络。在这个网络中存在三个3节点 
小团体，分别是 ABE 、 BDE 、 BCD 。 由于从节点 E 到 C 的关 
系是非互惠的，因此 EBCD 不构成一个有向小团体。同样 ， A 
和 C 之间由于对偶关系的缺失也导致 AFC 不能成为一个有 
向小团体。 



从无向图 n - 小团体的定义得到启发，研究人员提出，通 
过改变对偶连接的对点间的测地距值，可以放宽小团体定义 
上的严格要求。这一方法与前面的方法具有极大的相似性， 
除了更多的考虑有向连接问题。例如，2节点可以通过四种 
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情形生成&连 接:弱 n - 连接、单向 rz - 连接、强 n - 连接、双向 
连接 ( Peay ， 1980； Wasserman &- Faust , 1994:275)。在最强 

形式的 r 连接——双向&连接——中，从〗到 j 的最短路径 
和从 J 到 f 的最短路径必须通过同样的节点，不过是方向相 
反而已，而且其路径长度等于或小于 n 。 这四种情形的每一 
种都构成了一个有向 n - 小团体，产生了四种类型的^小团体 
亚群体。在图 4. 11中，子图 ABCDF 是一个双向2-连接，因为 
它的10个对点通过测地距1或2都是互相可及的。然而 ， E 
不包括在内，因为它得不到 C 的反向连接，导致由 E 至 C 的测 
地距长要短于由 C 至 E 的两条测地距长 (C-I>E 和 C-BrE ) 。 
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第6节 I 结构等价 


社会科学家常常不仅对行为人的内聚力感兴趣，还对行 
为人的平等状态感兴趣。这种平等指在一个网络中两个或 
多个行为人与他人具有同样的或非常相似的关系。结构等 
价的行为人之间一般来说具有竞争型而非内聚型关系。譬 
如，两个大白菜种植者都将他们的产品卖给同一批蔬菜批发 
商，因此在出售大白菜时他们的关系就是结构等价，处于激 
烈竞争状态。结构等价的行为人完全可以互相替代。如果 
一个种植者退出蔬菜供应网络，那么他的位置很容易就被另 
外的结构等价的种植者替代，从而保持原来的网络不发生变 
化。为了从其他网络参与者那里获取适宜的反馈，社会网络 
中的完全可替代性常常导致激烈的竞争，众所周知的例子就 
是小学生为了获得老师的特别青睐而互相竞争。利用结构 
等价方法的网络研究学者往往对理解竞争关系有兴趣，而不 
是对群体内聚力有兴趣 (Burt, 1992 )。 

与小团体的定义类似，结构等价的定义也是非常严格 
的。在有向二进制图中，如果两个行为人在与他人发送和接 
收关系时具有完全相同的连接模式，那么他们在那种具体关 
系上就是完全结构等价的。更详细地讲，对于网络中所有的 
节点玖但不包括节点 z ‘ 和乃 ，如果节点 i 发送一个连接给是， 


第 4 章网络分析基本方法 I 123 


当且仅当节点 j 也发送一个连接 给々; 如果节点 i ) kk 接收一 
个连接，当且仅当节点） 也从々 接收一个连接，那么节点；和 
j 就是结构等价的 (Wasserman Faust ， 1994:356)。对于 

多重网络来讲，如果两点结构等价，则上面讲的这个条件必 
须在 i ? 种关系的每一个当中都要精确把握。节点£和）之间 
有向连接的存在与否，对于决定它们是否结构等价是无关 
的。它们的结构等价仅仅是由它们与 S — 2 个其他网络点的 
关系模式来决定。 

无向二进制图不区别关系的发送者和接收者。因此，将 
上述有向关系结构等价的定义沿用至无向图，如果对于网络 
中所有的其他行为人 L z 与 A 具有连接，当且仅当点 j 也与 
k 具有连接，那么 i 和 j 就完全是结构等价的。结构等价也 
可以用在赋值图中，其中利用排名等级而非二进制赋值来测 
量两节点之间的连接。严格来讲，只有当赋值图的两个节点 
在与其他节点的每一个连接中都具有完全同样的值，这两个 
节点才是结构等价的。 

对于实证网络分析的实际运用来说，完全结构等价性的 
上述定义通常太过严格。真实网络数据中极少有数据能够 
满足这样苛刻的标准。然而，当一些节点与其他节点的关系 
模式高度相似，尽管不是完全相同，但我们也可以认为这些 
节点是大致结构等价的。为了获得这种近似性，研究人员利 
用关系相似性的测量，而不采用严格的、非此即彼的完全结 
构等价的标准要求。两个节点各自与其他所有节点的连接 
越相似，那这两个节点就越接近结构等价。 

基于网络关系相似性的两节点间的结构等价，只要求他 
们与其他节点或有或无的关系模型高度相似即可。假定存 
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在一个二进制有向图，两个结构等价的行为人，在其社会矩 
阵对应的行和列中的条目非常雷同。根据这一原则，伯特 
(1978) 提出将欧氏距离作为测量行为人 i 和行为人 j 结构等 
价的一种 方法： 

dij = 2 [( x * ~ + ixki — Xkj j 

V 4 = 1 

[4.13] 

其中办是行为人 i 和行为人 j 之间的欧氏距离，是社会矩 
阵(第一个下标表示行，第二个下标表示列)的值(对于二进制 
关系来说就是1或0)。由于4是两个差值的平方和的正平 
太根，因此每个而 >0。假如行为人 i 和行为人 7 与其他行为 
人之间拥有非常一致的连接，那么所有的差值（耶 一 巧）和 
(xk —叫） 都是0;因此这两个完全结构等价行为人的欧氏距 
离右= 0。但是在绝大多数实际例子中，观察到的办值要大 
于0;因此，行为人£和行为人 j 在某种变动的程度上关系类 
似。欧氏距离与行为人的相似性相反，因此也与结构等价相 
反:办 值越大，行为人 〖和 行为人 j 的结构等价度就越小。也 
就是说，欧氏距离实际上测量的是一对行为人之间的异质性。 

为了阐述如何计算对点之间的欧氏距离，图 4. 12和表 
4. 3分别描述了一个5-节点网络结构的有向图和矩阵式。图 
4. 12表明，行为人 A 和行为人 B 是完全结构等价，因为他们 
都与行为人 C 和行为人 D 有直接联系，但都与行为人 E 没有 
联系。相反，行为人 D 和行为人 E 就不是结构等价了，因为 
尽管他们都发送了一个连接给行为人 C ， 但是行为人 D 接收 
了行为人 A 和行为人 B 的连接，而行为人 E 却没有得到任何 
连接。利用表 4. 3的二进制值，可以计算行为人 A 和行为 
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人 B 的欧氏 距离： 

KixjiC ~ XBc ) 2 + iocCA —XCb) 2 ~\ + \_{xad — 工 BD ) 2 + 
dAB = / 

V (xm — xib) 2 ] + L(xae ~xee) z + (joea — xeb) 2 ] 

/ [(1 - I ) 2 4 - (0 -^ 0 ) 2 ] + [(1 - I ) 2 + (0 - 0 ) 2 ] + 

di2 = I ， 

V [(0-0) 2 + (0 — 0) 2 ] 

[4.14] 

其中 < ii 2 = 0，表明行为人 A 和行为人 B 是完全结构等价。 
你能否算出点 D 和 E 之间的欧氏距离是= 1. 41? 

由于无向二进制图不区分关系的发送者和接收者，因此 
它的欧氏距离计算就简单 得多： 


dij —JOjk) 2 ^ k) [ 4 . 15 ] 

当网络呈现多重关系时，欧氏距离就得计算所有 i ? 种关 
系的对点差值的平 方和： 

/~ R ~8 

dij —Xjkr) 2 + (xkir ~ ) 2 ] (l 7^ 7 7^ k) 

V r=l A =1 

[ 4 . 16 ] 

与通过欧氏距离来计算异质性不同的是，皮尔逊相关系 
数^直接测量关系的相似性，其中对点关联值越髙，表明结 
构等价度越大。我们将在本节块模型部分讨论相关性问题。 


E © A © © B 



图 4. 12 5- 节点网络的结构等价有向图 
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表 4. 3 5-节点网络的结构等价矩阵 
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第7节 | 视觉演示 


网络图像在社会网络研究中普遍用于展现和传递网络 
结构的亮点。社会网络分析在视觉演示的发展过程中经历 
了三个明显的阶段 (Freeman ， 2000, 2005)。起始阶段大概 
在20世纪30年代，当时雅克布_莫雷诺发明了一种手绘的 
即兴社会网络图，用来描绘诸如学生等行为人之间的关系 
(Moreno, 1934)。这种自由式的方法很快就让位于通过标 
准计算程式来标示点和线的图。可视化初始阶段的一个基 
本原则就是所示空间应该代表行为连接的模式，即在数据矩 
阵中社会关系最近的对点，在可视图像中也能看得出来是距 
离最近的 (Freeman ， 2005)。然而，在二维或三维的视觉展 
示图中，精确标注多位行为人之间关系的亲近度和距离，通 
常是不可能完成的任务。因此，研究者最终采用系统简化、 
维度减少但依然能够反映原始数据模型的办法。可视化第 
二阶段始于大约20世纪60年代，用大型电脑主机和软件自 
动生成图表。尤其需要指出的是，网络分析不断利用这部分 
将要讲到的分层聚类法和多维标度法。最近的阶段始于20 
世纪90代中期，随着因特网、高速计算机网络和浏览器，以 
及个人电脑普及化时代的到来，关系数据库的大型可视化展 
示，包括纵向网络变化的动画展示，就有了新的机会（如 
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Brandes ， Kenis ， Raab，Schneider Wagner , 1999； de 
Nooy , Mrvar &• Batagelj , 2005) 0 

因为篇幅有限，我们就集中讨论分层聚类和多维标度这 
两个展示网络数据的基本理念。可视化展示对于用社会网 
络数据来探索发现内聚型亚群体以及揭示它们内部的关联 
性是非常有用的。在此过程中，可通过将众多行为人概括为 
数量较少的共同占据位置，对复杂的网络结构进行简化。结 
构等价方法计算和分析对点异质性(欧氏距离)或相似性(关 
联指数)的矩阵模型，来确认由行为人与其他人相同或相近 
关系模型所构建的亚群体所占据的网络位置。聚类和多维 
度标示法运用于结构等价矩阵，来确认共同占据位置，以二 
维或三维图的形式来展示结果。 

聚类 

分层聚类分析，或者简称为聚类分析，将行为人分成亚 
群体(共同占据位置）。这些亚群体成员是标准的或近似的 
结构等价。每一个行为人开始都被当成一个单独的聚类，然 
后这些单独的聚类依次联合起来，直到合并成为一个独立的 
聚类。一个树图，也被称为树形图，形象地展示了这个合并 
聚类的层次顺序。 

聚类演绎法一般处理 gXg 阶方阵的欧氏距离(办）或 
关联指数(^)，其中 g 是具体关系中的行为人数量。聚类分 
析的一项比较研究发现，这两种方法都得到非常相似的结 
果，虽然使用相关性概念的聚类分析会相对容易解释 
(Aldenderfer &. Blashfield , 1984:24— 28) 0 多重网络关系 
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CR ) 可以同时被聚类，通过构建一个 gXgXR 维的数据阵 
列，在进行聚类分析前，计算所 有只矩 阵中的每对点间的欧 
氏距离或相关性。虽然分层聚类可用于二进制数据和賦值 
数据，但为简化的缘故，我们主要对欧氏距离的二进制对称 
矩阵进行讨论。 

在计算对点的欧氏距离矩阵之后，聚类分析开始根据一 
个阈值《对行为人进行合并。这个阈值作为分析者的一个 
上限，让他们决定在一个结构等价的特定水平上，哪一个行 
为人属于同一个关联性占据位置(聚类)。仅当办时，行 
为人 f 和）共同占据一个位置。在一个聚类中的行为人互相 
之间的社会距离要小于他们与其他聚类中行为人的距离，即 
聚类内的行为人更具有结构等价性。通过聚类演绎法，不断 
将《的值放宽(即《值变大)，并运用于整合行为人的过程，直 
到整个网络合并成一个单一的全涵盖聚类。尽管分层聚类 
法获得一些非交叉聚类，但聚类还是嵌 套的; 也就是说，较小 
的聚类依次包含在 a 值高的较大聚类中 （ BU ， 结构等价度越 
低，相似性越小，那么聚类内距离就越大)。最终，研究人员 
必须决定哪一个层面的块（即哪一个 a 值)能够为网络中结 
构等价位置数量提供最好的替代。 

研究者可从形成聚类的三个基本标准中进行选择 :单个 
联结、平均联结或完全联结。给定 a 值的水平，当两个关系 
最为亲近的行为人距离小于 a 时，单个联结标准将两个聚类 
合并成一个聚类。在完全联结标准下,当每一对行为人的距 
离小于 a 时，两个聚类进行合并。平均联结标准是一个折中 
的选择，要求两个合并的聚类中两类行为人的平均距离小于 
a 0 实证研究发现，每一种选择都存在有利和不利的一面，研 
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究者应当根据具体的情况来调整所选的聚类分析方法（入1_ 
denderfer &- Blashfield , 1984:53—62)。完全联结聚类倾向 

于得到数量众多的同质型和紧凑型的聚类，而产生“链”的可 
能性较低。“链”在这里指依次增加一个行为人即可形成一 
个单 一 的较大的聚类 （ Burgin ， 1995; Wasserman &- Faust , 
1994:381)。 

前面的内容主要讨论了小团体、聚类和结构等价等有关 
的概念和方法。这些网络分析方法普遍用于揭示社会结构 
的基本要素，诸如社会内聚力(小团体和聚类)或结构性竞争 
的程度(结构等价性）。因为这些方法探察社会结构的中间 
层次，它们承上启下，将社会网络的微观模式与社会结构的 
全景网络连接起来。下面我们讨论多维标度，这是揭示网络 
行为人结构的另一个非常重要的方法。 

多维标度 


多维标度 ( MDS ) 是将数据结构进行可视化处理的第二 
个基本方法。 MDS 的主要目的是，发现那些能够反映网络 
行为人之间相似性和差异性(距离）的有意义的维度。如同 
聚类分析所述， MDS 的典型要素是一个欧氏距离为 Wo ) 或 
关联指数为(^ ) 的 gXg 阶矩阵，其中 g 是具体关系中行为 
人的数量。 MDS 的可展现结果是一张图，或称为社会关系 
图，其中较短距离(较大相似性）的关系行为人比较远距离 
(较大差异性)的关系行为人在空间上要离得近一点。虽然 
MDS 图能够展示多个维度，但大多数分析一般都只是表达 
二至三个维度。 
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在 MDS 图中所表示的行为人之间的距离与输入矩阵图 
中的相似性或差异性值相关但不完全相同。这个距离反映 
的是通过 MDS 程序所估算到的这些数据中对点间的距离。 
应力这一概念测量所观测到的矩阵和所计算到的矩阵二者 
之间所有点的差异性 (Kruskal & Wish , 1978:23—30): 


Stress 


SS(/( 叫 )- 心 ) 2 

Scale 


[4.17] 


其中， / Ud 是输入值的一个非计量性的、单一的函数 
(Kruskal & Wish , 1978:29) ，匈是呈现在图中行为人/和行 
为 Aj 之间的欧氏距离。 Scale 是一个应力值在 0. 0至 1. 0之 
间的测量指示因子。如果一个 MDS 图将一组输入数据转化 
成标准的图值，那么对于所有的〖和 j 来说/(%二如），应 
力将等于0。所以，应力值越低， MDS 图的空间就越能够代 
表所观测到的网络行为人的社会距离。基于这个原因，应力 
概念也被称为 MDS 拟合度的测量法，其中应力值低于 0. 1 
被认为是拟合得非常好，应力值在 0. 1至 0. 2之间被认为是 
拟合度适中，应力值大于 0. 2就拟合较差 (Kmskal & Wish , 
1978：52； Slez Martin , 2007 ) Q 

MDS 曾经被运用于各种研究。例如，斯莱兹和马丁 
(Slez & Martin , 2007) 利用 MDS 对各州一段时期内随时间 
变化投票的相似性进行绘图比较。维特、金和格利克 ( Whit ， 
Kim & Click , 2005) 对多伦多地区的50个种族群体绘制了 
社会空间位置图。 MDS 的最大优势，是允许他们同时分析 
所有的种族群体，而传统的分隔研究方法则将每一个群体与 
所有其他群体进行分离对比。 
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为了描述聚类和 MDS 这两种方法是如何能够一起联手 
揭示结构等价网络位置，我们可以看图 4. 13和图 4. 14。图 
4. 13分层聚类树图和图 4. 14 MDS 图都是基于欧氏距离，而 
该欧氏距离是从图 4. 12的二进制网络数据计算出来的。聚 
类分析使用完全联结选 择:当 所有行为人之间的距离小于 a 
值时(这些值显示在图 4. 13图的水平轴上），聚类合并在一 
起。例如，行为人 B 和 E 间的欧氏距离 (《) 是 0.00 (标准的结 
构等价)，因此树图首先在欧氏距离等于 0. 00这一阶段将 B 
和 E 合并。有两个聚类岀现在欧氏距离等于 1. 00这一 阶段: 
一个聚类合并了行为人 A 和 C ， 另一个聚类将 D 与这一 
现存的聚类合在一起。在欧氏距离 a = 1. 73时，这两个聚类 
合并了，表明所有对点的欧氏距离都小于 1. 73。最后，在欧氏 
距离 a = 200时，行为人 F 与 A - B ^ C - D - E 聚类合并，表明 
F 和所有其他节点之间的欧氏距离在 1. 73至 2. 00之间。 


0.00 1.00 1.73 2.00 

A - 

C - 

B ― 

E- ~~ - 

D - 

F - 

图 4. 13图 4. 12的网络分层树形图 

图 4. 14的 MDS 图中，行为人亚群体周边有邻接线，这 
个位置正好是在聚类树图中 a - 1. 00所确认的三个聚类所 
占的位置。 
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行为人 B 和 E 在图中正好占据着同样的点，因为他们是 
完全结构等价。虽然对于确认聚类来说，《值的选择在一定 
意义上是随意的,但我们仍然建议选择一个值，它能够平衡 
网络行为人之间的内聚力和分裂性。例如，如果我们已经知 
道欧氏距离为 0. 00,那么我们将有五个 聚类: B 和 E 构成一 
个聚类，另外四个行为人占据单件聚类的位置。为方便比 
较，现假设我们选择《 = 2. 00,那么结果只有两个聚类: （ A — 
B - C — kE ) 和 ( F )。 第一个选择标准，由于其亲密关系设 
置上的高门槛，产生了大量的分 裂性; 而第二个值，则使得门 
槛降低，得到了较大的内聚力。然而，没有一个方法能够像 
中间值《 = 100时提供的信息，即揭示联合占据位置之间的 
结构关系，为这个网络的分离性与内聚力提供一个更平衡的 
视角。 

MDS 的一个延伸运用是加权多维标度 ( WMDS )。 它在 
传统的 MDS 方法中增加了加权因素，用于代表矩阵间变化 




社会网络分析(第二版) 


的信息。因此, WMDS 允许多重矩阵被进行系统性地区分， 
从而对距离模型进行概括。例如，假如每一个矩阵都对应一 
个不同的个人，那么 WMDS 利用权重就可以对这些个人思 
考和想象他们的关系进行不同的刻画。基于这个原因， 
WMDS 也被称为个体差异标度 ( INDSCAL ) 。虽然我们不能 
在这里更详尽地讲述 WMDS ， 但我们鼓励有兴趣的读者向希 
夫曼、雷诺兹和杨 （Schif fman ， Reynolds Young ， 1981 : 
55 — 85) 咨询； 还有韩 （ Han ，2003) ，他对此方法有最新的 
运用。 
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第8节 I 块模型 


块模型是一个矩阵代数方法，将网络行为人分类成联合 
占据的、结构等价性的位置。块模型方法开始由哈里森•怀 
特和他的助手研发 （Boorman & White , 1976; Schwartz , 
1977； White et al . , 1976) 0 自此开创性工作之后，研究者已 

经将块模型方法成功地运用到各种问题研究中，从跨组织网 
络 (Knoke Rogers , 1979) 到新技术的扩散 （Anderson & 
Jay , 1985)，再到世界体系中的城市角色 (Alderson & Beck - 
field , 2004)。方法研究者也加深了块模型搜索和划分法则 
的研究 （Nowichi Snijders , 2001 ； Winship &• Mandel , 

1983； Wu , 1983)。 因为篇幅有限，我们在这里不继续讨论 
这个大的话题，在本节集中讲述块模型的基本问题及其应用 
和结果的阐释。 

块模型是 g 个行为人社会网络矩阵的一个部分，它将一 
个或多个关系网络，分成两个或多个被称为块 ( B ) 的亚群体 
或位置。块这一术语指结构等价行为人的一个亚方阵，其中 
的行为人与其他块中的行为人具有相似的(如果并非完全相 
同的话)关系。建立块模型是一个数据简化技术，通过重新 
对行为人进行分组，提出浓缩的综合信息，它将对网络数据 
进行系统性搜索，从中找出关系模型。结果就是重新排列置 
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换过的密度和图像矩阵，表示每一种类关系中块内部和块之 
间的联结方式。块模型可以被用于单个或多重的关系，有向 
或无向的联结，二进制或赋值的图。我们的块模型例子是基 
于 UCINET 的 CONCOR 运算法则，它能够同时处理二进制 
数据和赋值图。我们这里只讲述二进制数据矩阵，并推荐读 
者阅读多里安、巴塔格尔基和费力格基 (Dorian, Batagelj & 
Ferligoj, 2005:347— 360) 的相关文献，以进一步了解二进制 
数据和赋值图的块模型分析。 

可以利用理论原则事先构建一个块模型，例如将不同管 
理部门的雇员分类成不同的块。然而，该方法的最普遍运用 
是对关系数据的经验模式进行调查搜寻。建立块模型常常 
使用 CONDOR(Convergence of iterated Correlations) ， 这一 

方法在多个社会网络分析程序中都可以找到 （Schwartz, 
1977)。 CONDOR 可以通过关联对行、对列，或者同时通过 
关联矩阵的两个向量进行运算。为教学之便利，我们这里仅 
讨论关联列项。首先， CONDOR 计算二进制 gXg 阶社会网 
络矩阵图中每一对列项的皮尔逊相关系数(对于块模型只多 
重关系来说，独立的 gX g 矩阵是堆积起来的，即安排成为一 
个单独的二维数据阵列，其目的是输入给 CONDOR)。 这些 
计算不包括每对点间的直接联结，因为它们的结构等价性仅 
仅依赖于对点与其他 g — 2个网络行为人的联结关系。假如 
行为人 〖和 7与其他行为人有着几乎完全相同的联系，那么 
他们的相关系数 n：； 将等于 1. 0。相反,如果两个行为人有着 
几乎完全相反的联系模式，那么他们的相关系数等于一 1. 0。 
实际的相关系数几乎总是在这两个极端值之间。从 con ¬ 
dor 开始得到的结果是一个有关每对行为人的 g X g 阶对 
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称的关联矩阵，表示每对点结构等价性的程度。第二步，其 
后的所有迭代步骤，都重复着前一步关联矩阵中的对列关联 
过程。在一定程度上，矩阵每一格的相关系数都趋向于 1.0 
或一 1. 0,直到达到这两个点时迭代中止。 

接下来， CONDOR 将最后的关联性矩阵排列成两个同 
质的块。社会网络矩阵的排列包括同时对行和列的重新安 
排，以将这些占据同样块位置的行为人一起排在相邻的位 
置。 CONDOR 对社会关系网络的初始分区和排列总是得到 
两个分矩阵，它们在行为人的数量上不一定相等，在同一块 
内每对行为人的所有关联指数都等于 1. 0,但是两个块之间 
的关联性却是一 1.0。重复这一过程， CONDOR 能够将初始 
得到的两个块中的每一个都续分成两个，以此类推。网络研 
究者必须决定在何处停止这一分化过程，因此也就决定了最 
终所得到的块的数量。 

块模型分析导致两个主要形式的 结果: 密度矩阵和相应 
的图像矩阵。密度矩阵是一个阶矩阵，它的单元格的值 
是块内和块间的密度(密度是一个比例，其计算是由重新排 
列所得子矩阵中所观察的联结数量除以可能的所有联结数 
量)。图像矩阵也是一个 6 X 6 阶矩阵，通过将密度矩阵中的 
每一单元格的密度值编码为0或1转化而来。下列两个可 
替代标准可以用来决定图 像值: （1) 行为人之间没有联结的 
格 (0 -块)编码为0,行为人至少有1个联结的格 (1 -块)编码为 
1; (2) 研究者选择一个密度临界值 a ， 那么在这个临界值之下 
的所有密度编码为0,所有等于或高于 a 值的编码为1。上面 
第一个选项是一个不现实的标准，因为实际密度为 0. 0的情 
形很少发生，除非一个网络中的关系很少，从而几乎所有图 
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像矩阵中的每个单元格都有1构成。第二个选择是最经常 
碰到的情形，它利用《密度临界值对图像值进行二项分类。 
研究者都选择满矩阵的密度值作为临界值。然而，因为选择 
a 值不可避免地要受到研究人员的判断问题，因此一个选定 
的特定值容易受到独断性方面的批评。为了回应此类批评， 
研究人员应当尽量在理论和实践上提出合理理由，而不能仅 
仅诉诸利用之方便 ( Scott ， 1991:136)。 

作为块模型运用的实际范例，我们分析了美国1988年 
里根政府执掌行政权力时期国家劳工政策领域中的政策交 
流网络 (Knoke et aL ，1996)。这个政策领域的核心由24家 
最有声望和影响力的政治组织组成，由知情人士从117个该 
领域的组织中选出(参见表 4. 4,组织名称首字母缩写）。图 
4.15 是得到确认的有关劳工政策事项的交流网络的有向图 
(对于一个存在的有向联结，一对组织必须认同所发出的信 
息也得到了接收）。在这个值 (0.29) 之内的高密度联结，使 
得这个图中任何简单的结构都难以辨认。对应的交流关系 
矩阵，在表 4. 4中被转化成一个同时利用行（发送者）和列 
(接收者)的关联矩阵。这些关联测量每对组织与其他22家 
核心领域成员的交流模式的相似性。之后，对这个关联性矩 
阵进行 CONDOR 分析，得到表 4. 6这样一个含有四个模块 
的区分、密度和图像矩阵。 

为了决定图像中的 1- 模块，选定的密度临界值 (《) 等于或 
高于 0. 33。最后，在图 4. 16中关联性矩阵的 MDS 分析，利用围 
绕四个模块成员的邻接线，展示了核心组织之间的距离。 

在社会关系图中，联合占据的块的构成及它们的定位， 
反映了 20世纪后期美国的劳工和资本之间的基本政治裂 
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度。在图 4. 16的右下角，模块1是一个由四个工会组织组 
成的支持劳工派，包括 AFL - CIO ®， 代表老年人利益的集团 
( AARP ) 和参议院劳工委员会的民主党派。较小的模块2包 
括三个利益集团和 ETA (联邦劳工部的一个下属机构）。模 
块3站在支持商业的立场，由里根白宫政府、劳工部、三个商 
业组织，还有卡车司机工会(它不是 AFL - CIO 成员）。模块4 
也主要是站在支持商业的立场,包括其他的三个国会委员会 
(两个共和党群体和一个众议院民主党派）和两个主要的商 
业组织(商业圆桌会议和美国商务部）。根据表 4. 5的图像 
矩阵，每1个块包含着内部政策交流的高密度，但是在12个 
块间密度中只有3个块存在经常的联 结:支 持劳工派的块1 
发送政策信息给块4的国会部门，而国会部门所在的块4和 
支持商业的块3也互相交流信息。虽然块模型和 MDS 分析 
反映了它们在理念上的清晰区分，但一些组织（例如国会众 
议院民主党派人士和卡车司机工会）出现在未曾料想的位置 
上，意味着政策交流在朋友之间和敌对方之间都会发生，这 
也许可以缓和美国国家劳工政策领域政治对立的紧张程度。 


表 4. 4美国劳工政策领域核心交流网络的二进制矩阵图 


1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 
123456789012345678901234 


1 AFL 011110011000001111001111 

2 ASCM 100100000001001000000100 

3 TEAM 000100101000100001111110 

4 UAW 101010000000000000000101 

5 USW 100100010000000000001100 


①劳联一产联，美国最大的工会联盟。——译者注 
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续表 

111111111122222 

123456789012345678901234 


6 ABC 000000111010000101011110 

7 AGC 001001011010000101011111 

8 BRT 000000101110001111010010 

9 CHAM 001001110110110101111110 

10 GM 000000011010000000001110 

11 NAM 000011011100000100011010 

12 NEA 100000000000010000000000 

13 AARP 101000001000000000000111 

14 ACLU 100000001001100000000001 

15 NGA 100000000001000111010000 

16 DOLS 000000011000000000001110 

17 ETA 100000001010000000000010 

18 OSHA 001101100000000100000000 

19 NLRB 001000001000000000001010 

20 WHO 101001111100000001000110 

21 HR 001000011110000100100010 

22 HD 000000000000000000000000 

23 SR 000000000000000000000000 

24 SD 101110000000100000100000 


AFL: 美国劳工联合会 ASCM: 美国州县市工人 TEAM: 卡车司机工会 

联合会 

UAW: 汽车工人联合会 USW: 钢铁工人联合会 ABC: 建筑工人和承包 

商协会 

AGC: 通用承包商协会 BRT: 商业圆桌会议 CHAM: 美国商务部 

GM: 通用汽车公司 NAM: 全美制造商协会 NEA: 美国教育协会 

AARP: 美国退休人员 ACLU: 美国民权同盟 NGA: 全美州长协会 

协会 

DOLS: 劳工部 ETA: 劳工部教育和培 OSHA: 职业安全和健 

训管理局 康管理局 

NLRB: 全国劳动关系 WHO: 白宫办公室 HR: 众议院共和党劳工 

委员会 委员会 

HD: 众议院民主党劳 SR: 参议院共和党劳工 SD: 参议院民主党劳工 
工委员会 委员会 委员会 




网络分析基本方法 


BB 


黎】 


美国国家劳工政策领域关系有向图 


ABCAGC 


GM DOLS 


乂 Block 3 


Block 2 


Block 1 


Block 4 


美国国家劳动政策领域关系的块状多维标度 
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Density Matrix 

12 3 4 


Block 1 0.567 0.167 0.125 0.389 
Block 2 0.250 0.333 0.094 0.167 
Block 3 0.104 0.000 0.393 0.613 
Block 4 0.056 0.125 0.456 0.367 


Image Matrix 
12 3 4 


Block 11001 
Block 20100 
Block 30011 
Block 40011 


Blocked Matrix 

2 1 
1 2 4 4 5 3 


表 4.5 美国劳工政策领域中的核心交流网络的分块阵、密度阵和图像阵 
















■ 
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在这一章中，我们将讨论有关网络分析的髙级方法。我 
们尤其要讨论网络位置测量、 logit 模型 〆 、隶属网络和点阵 
分析。 



第 5 章网络分析离级方法 
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第 1 节 I 网络位置测量 




...; …: . . :,,乂,；^; 



在社会网络分析中，角色和位置是核心概念。利用代数 
和矩阵方法对互锁角色的分析，始于& F . 纳德尔 （& F . 
Nadel , 1957) 关于社会结构的理论。在其理论中，他将社会 
结构视为位置，而该位置拥有与其他位置相关的独特的权利 
和责任。在第4章讨论过的结构等价，为确认社会网络角色 
和位置提供了一个基本的方法。然而，它要求结构等价的行 
为人与同样的其他行为人具有相同的连接模式，这一要求对 
于该方法的实际运用来说，太过苛刻。虽然放松关系相似性 
这一要求可以扩展该方法的运用，但是在行为人基于自身的 
关系模式联合占据位置方面，结构等价依然有着非常严格的 
定义。作为一个替代性选择，网络研究者创造出多个适用条 
件没有如此严格的方法来确认网络角色和位置 (Borgatti & 
Everett ， 1992； Everett , 1985; Everett , Boyd &- Borgatti , 

1990; Faust , 1988； Pattison ，1988)。 在适用条件严格的降 
序排列中，结构等价是最严格的，其次是自形和同构等价，再 
次是正规等价。本部分对后两种方法进行非技术性的一般 
回顾。虽然自形和同构等价经过一些调整能够被用于有向 
和赋值图 (Wasserman Faust , 1994： 461—502)，但为了便 

于阐述，我们还是在举例中利用了一个单个关系的无向二进 
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制图。 

同构和自形等价是两个关联性很强的概念，以至于一些 
研究者认为它们是可以互相替代的 （Borgatti Everett , 
1992)。但是，同构等价运用于两个图，而自形等价只能描述 
一个图中社会关系行为人的关系特征。如果一个图到另一 
个图的节点有着一对一对应关系，维持了所有节点的邻接关 
系(例如，同样的点人度和点出度），那么这两个图就展示了 
结构上的同质性。也就是说，如果在第一个图中两个节点相 
连，那么在第二个图中相应的两个点也必然以同样的方式相 
连 (Borgatti Everett ， 1992:11)。每一个图自身是同构的， 

这就被称为自形形式，也就是一对一的对应关系映射到它自 
身。当且仅当两个节点与相应的其他位置(但不是同一个节 
点)连接时，这两个节点就是自形等价(即联合占据着同样的 
位置)。自形等价节点有相同的图论特征，比如中心度、自我 
密度、小团体规模 (Borgatti & Everett , 1992)。 

自形等价放宽了结构等价的要求，即在同一位置上的行 
为人与同样的其他行为人有着相同或非常相似的联结。相 
反，如果行为人与扮演该位置相同角色的不同行为人有着同 
样的联结，那么自形等价认同行为人共同占据着一个位置。 
举一个熟悉的例子 :如果 两个教授占据着结构等价的位置， 
那么他们两个必须教同样的一群学生，这实际上是不太可能 
的。.但是，如果说要构成一个自形等价位置，这两个教授所 
教学生可以不同，但只需要所教学生数量相同即可。学生占 
据着第二个位置，由教授所教的人来定义。图 5.1 比较了这 
两种类型的等价，其中从教授到学生的有向连线表示“教学” 
关系。尽管这两个图显示有两个位置，但自形等价图更好地 
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抓住了一个理念，即社会角色包含关系的一般模式。现在可 
以引述另外一个著名的例子 :一夫 一妻制婚姻。我们期待妻 
子的位置可由一群女性共同占据，她们与同一群男性有着非 
多妻制婚姻，但是她们每一个人都单独地与不同的丈夫形成 
配偶关系。 

结构等价性行为人也是自形等价型的，但反之则不一 
定。如果行为人标签从图中移走，那么自形等价型的节点则 
不能区分。因此，如果图 5.1 B 中的名字被点所替代，那么这 
两个子图就无法区分了。博加蒂和埃弗里特 （Borgatti & 
Everett , 1992: 16) 如此总结这个 区别： 

“简要一点来说，我们可以认为，在结构等价方法 
中，网络或标示图可以代表一个群体的内在 结构； 因此， 
在该机构中的行为人的定位就代表了他/她在群体中的 
位置。相反，在自形等价方法中，利益群体的结构并不 
是标示图 本身； 标示图被视为观测结构或表面结构，但 
表面结构的结构，是潜藏于标示图之下的未标示图。因 
此在这个‘深度结构，中的行为人定位，才真正代表着他 
/她在群体中的位置。” 

A . 结构等价 
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B . 自形等价 



图 5.1 结构等价与自形等价 


通过放宽结构等价标准，自形等价法大大便利了对许多 
社会理论进行实证研究。博加蒂和埃弗里特 (1992) 认为，有 
几项采用结构等价操作理论的研究，如果采用自形等价进行 
分析会更好。例如，他们用此方法回应了伯特 (1979) 的研究 
计划。这个研究计划将一个经济体的行业和部门定义为生 
产相似类型产品、在跨组织网络内占据单一位置的单位集 
合。博加蒂和埃弗里特 (1992:21) 则宣称，结构等价性单位， 
如果按照定义，必须要从同一供应商购买原料，产品必须要 
销售给同一代理商，实际上这不太可能组成任何符合该定义 
的部门。但是自形等价单位，则只需要从相似的供应商购买 
原料，将产品销售给相似的顾客，就能够很好地构成满足要 
求的行业和部门了。 

正规等价是三个常用等价形式中条件最为宽松的一个。 
它既不要求结构等价中与相同行为人的联结，也不要求自形 
等价中不可区分的位置。如果行为人与其他也是正规等价 
的行为人具有同种类型的关系，那么这些行为人就是正规等 
价的。将这一想法进行概念化的另一条途径是，如果占据一 
个位置的第一个行为人与占据第二个位置的行为人进行联 
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结，那么如果第二个行为人构成正规等价，则它必须与第二 
个位置上的其他行为人有着一个相同的联结 (White Re ¬ 
itz ， 1983:214)。 

所有拥有孩子的母亲都是正规等价，而不论她们孩子数 
量的 多少; 反过来也一样。在医院里，医生与他们的患者和 
护士的关系，也是正规等价的，即使每个医生所属的病人和 
护士数量不等。正规等价的这种特性使它可能成为社会学 
家分析社会角色和位置时最为重要的工具。 

自形等价和正规等价这两种方法都要求某对行为人与 
其他在同一种关系具有结构等价性的行为人联系。但是，自 
形等价和正规等价之间的区别有时也是模糊不清的。自形 
等价要求未标示图之间必须具有严格的可替代性，但是正规 
等价并没有要求子图之间具有完全的可替代性。 

为了解这种不同，图 5. 2描述了一个分等级的组织机构 
图。这个图由四个垂直的层次构成，其中的联结是监督关 
系。 CEO 监督三个执行经理 ( A 、 B 、 C )， 而这三个执行经理 
又监督下面四个中层管理者 ( D 、 E 、 F 、 G )， 再下层就是一些 
基层的雇员(从 H 至 N )。 如果我们忽略雇员层，那么执行经 
理人 B 和 C 就是结构等价，因为他们两个都监督着同样的中 
层管理者 ( F 和 G )。 但是， A 与 B 、 C 不是结构等价的，因为 
A 所监督的管理者不同。然而，这三个执行经理是正规等价 
型的，因为每一个人都监督着相同数量的中层管理者（两 
名）。如果我们考虑所有的等级层次，那么 B 和 C 也是自形 
等价型的，因为如果标示被移除，他们的子图都是可以互相 
替代的。但是， A 的子图不能被 B 和 C 的子图所替代，因为 
A 的两个中层管理者只监督三个基层雇员，而 B 和 C 的子图 
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每个都有四个雇员。 


CEO 



图 S .2 组织等级图的结构等价、自形等价和正规等价 


如果仅仅只看两个最低层的关系，那么四个中层管理者 
没有一个是结构等价的，因为他们都监督着不同的基层雇 
员。然而，其中三个中层管理者 ( D 、 F 和 G ) 是自形等价的， 
因为他们各自下属两个雇员，一旦移除标签，是可以完全互 
相替代的。而 E 不同，它只管理一个雇员。但是，如果按照 
监督至少一个雇员的标准，所有的中层管理者都符合正规等 
价标准。图 5. 2清楚地显示，结构等价是最严格的形式，而 
正规等价是最宽松的形式，自形等价则处于中间。对于确认 
一般化的网络社会角色，正规等价似乎是一个非常灵活的方 
法，它宽泛地定义一个社会系统中与其他位置具有相似结构 
性关系的行为人阶层或类别。 
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第 2 节 I logit 模型 ( p *) 


大多数网络分析方法都是描述性的，试图通过数据简化 
技术去展现一些潜在的社会关系结构，或者通过代数运算来 
归纳出网络关系的特征。而 p * 模型，这个重要的统计方法， 
它从对问题的描述提升到探索因果关系，即试图将对偶关系 
的存在作为个体和图论层次的解释因子的函数。沃瑟曼和 
帕蒂森 （Wasserman & Pattison , 1996) 最早提出 p * 模型。 
这个模型源于 Markov 随机图的早期版本 (Frank Strauss , 

1986) -有向图的 log-linear 模型 （ pi ) ( Holland &- Lein - 

hardt , 1981) ，而且还运用了伪似然估计的运算法则 (Strauss 
& Ikeda ， 1990)。在随后的发展中， p * 模型延伸至分析多变 
量关系 (Pattison & Wasserman , 1999) 和赋值关系 （ Robins ， 
Pattison Wasserman , 1999)。 p * 模型的上述两个运用描 
述了数据结构及其结果的解释 （ Anderson，Wasserman &- 
Crouch , 1999； Crouch Wasserman , 1998)， 并且提供了一 
个容易获取的介绍 （Wasserman & Robins , 2005)。这一部 

分将简要地讨论基本 P * 模型，并示范运用于一个拟制的网 
络 (Crouch & Wasserman , 1998： 87—101 h 虽然这个方法 

可以运用于多变量关系和赋值图的分析，但这里为简化的缘 
故，我们只处理一个单一关系的二进制有向图。有兴趣的读 
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者如果需要进一步学习，可以査阅上述有关文献。 

P * 模型与 logistic 回归密切相关。 logistic 回归分析二 
分因变量(作为二进制变量进行 编码 ： Y = 1或 Y =0)， 并假 
定这些变量是二项式分布。如果最小二乘回归法用于建立 
作为自变量的线性函数的 Y 的概率模型，那么会产生两个主 
要的问题:（1)一些预测概率可能会高于 1. 0或低于 0. 0,而 
这些明显是没有意义的概率值； （2) 违反了关于误差项的核 
心假设，特别是违反了等方差（同方差性)且正态分布的假 
设，以及误差项与自变量无关的假设。为了避免这些问题， 
logistic 回归模型将概率转换为 logits ， 具体 如下： 

logit ( Y ) = ^ n ( pr ( Y = 0)) = ^ +與及 + 译义 2 + … -\~jiXk 

[5.1] 

利用适当的转换#参数可以被解释为自变量对于 Y 的 logit 、 
odds 或概率的效应。 odds 转换是最普遍的，因为它比 logit 
更直接，比概率方法更简单 ( Pampel ， 2000)。为了获得自变 
量对 odds 的效应，在上述公式两边以 e 为底 取幂： 

^ I] = exp (^) +^ 1X1 + 啟 X 2 + … + pkX k ) 

— e & e^iyi … e^k [5. 2] 

这个公式表示，自变量对因变量为1相对于因变量为0的 
odds 的影响是可积的。第 f 个自变量对因变量 odds 的净影 
响是对回归系数取 e 次幂 (A ) 。 

P * 模型是应用到社会网络数据的 logistic 回归。对于 g 
个行为人之间存在二元有向关系的单一关系网络， gXg 阶 
矩阵 X 中的单元(£， ）) 是个二进制数， 
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[1 如果 f — 

X{, j = S 

lo 其他 

沃瑟曼和帕蒂森 (1996) 提出三个附加矩阵： （1) X +, 表示从 
f 到 j 强行存在的关 系链; (2) X 。表示从 f 到 ; ‘强行缺失的 

关 系链; (3) 表示从〖到 j 的附加关系链。使用这些矩 
阵，从〗到7_的关系链存在且依赖于附加关系链的概率如下 
所示： 


Pr ( xf , j = l \ x ^ j ) 


Pr ( x - xt ) 

Pr(x = x 方 ） + Pr(x — xjj) 


exp{6iZ(x 方 ) } _ 

exp{fiZ(o^)} + exp{6Z(x^)} 


[5.3] 


其中 0 表示估计的效应参数的向量， ZCrp 和 Z ( x ^) 分别 
表示不同自变量或解释变量的原始数据组成的向量。 

从；到 j 的关系链存在相对于关系链缺失的 odds 是： 

Pr(x t> j — 1 1 工 ^ ) — Gxp{SZ(x^) } 「 

Pr(x*, > = 0 I x^) exp{^Z(x^)} • 


两边取自然对数，然后把公式转 换成: 


log 


- Pr(:c “ j = I \ xfj) 
-Pr(x“ > = 0 I j:^) 



6 LZ ( xp ~ Z ( x^n 


[5.5] 


这个称 为 P # 的公式包括估计的效应参数0向量，和当 
强行把变量从1变成0时原始数据构成的向量。 

下面我们说明一下几个关于 P * 模型的问题。首先，分 
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析的单元是一个全幅网络中的 对点; 因此，对于 iv 个行为人 
组成的有向图，分析单元总数是 N 2- N ； 第二，虽然模型看 
起来像是估计对点的特征，但这实际上是整个图的模型。而 
且， P * 模型估计观察现在的图作为不同网络特征的函数的 
条件概率，将这些不同的网络特征(如选择、相互关系和传递 
性)作为自变量。第三，这些自变量的值是当从 〖到） 的给定 
关系链由存在变成缺失时，整个图的变量的合计值的差。例 
如，假设在某个特定图中相互关系链的总数是5,如果两个个 
体之间的关系链存在，如从行为人4到行为人5,然后把从4 
到5的关系链变成缺失,那么这个图中的一条相互关系链也 
将消失。因此，对于两个行为人 （4—5) 的自变量“相互关 
系”的值为1。 P * 模型实际上估计的是，如果关系链(％)是 
随机形成的，且每个有向关系链发生的概率相互独立时，观 
察到现在的图形的概率。 

为了说明 P * 模型，我们使用克劳奇和沃瑟曼 (Crouch & 
Wasserman , 1998) 中的二进制有向图。图 5. 3显示了三个政 

府研究机构(圆圈表示）和三个私立 R & D 实验室(正方形表 
示)之间的“项目支持”关系。例如，政府研究机构1和政府研 
究机构2之间有相互支持关系。虽然政府研究机构3给私立 
R & D 实验室4提供项目支持，但这个关系链不是互惠的，私 
立 R & D 实验室4对政府研究机构3不提供项目支持。 



图 5.3 三个政府研究机构和三个私立 R & D 实验室之间“项目支持”的有向图 
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项目支持似乎更常发生在同一类机构中，也就是说，更 
常发生在各政府研究机构之间，或各私立实验室之间，而不 
是机构和私立实验室之间。为了模型化这种“同类”假设和 
有关关系链存在的其他网络关系的假设，克劳克和沃瑟曼 
(1998) 建模用了五个 p * 参数：（1)整体选择度 ( W ; (2) 同一 
类型内的不同选择 ( ftj ; (3) 相互关系 <>) ; (4) 同一类型内的 
不同相互关系(~);(5)传递性 ( rr )， 关系是可传递的是指当 
每次从 i 到 j 存在直接关系链，从）到々存在直接关系链，那么 
从 i 到6也存在关系链 j i — k ) (Wasserman &- 
Faust , 1994:164)。 在实际的例子中，我们感兴趣的是项目 
支持是否更常发生在同一类组织之间，互惠的项目支持在同 
一类组织是否比在不同类组织之间更常发生。因此，要估计 
的参数向 量为： 


6 = {6, dw ， p ， fhu ， tt} 

估计有向图中所有两个行为人之间解释变量的向量，包 
括计算当£和）之间的关系链从1变成0时，原始数据的向 
量 Z ( x ) 的变化。 其中： 

2^' 表示解释变量“选择”。 

^ 表示变量“同一类型内部选择”。 

表示变量“相互关系”。 

工成 表示变量“同一类型内部相互关系”。 
z rr = Y ^ XijXjkXik 表示变量“传递性”。 

指标变量知是个二进制指标，当 i 和 j 是相同类型时， 
匈为1，否则为0。对于有 g 个节点的有向图， p * 模型中有序 
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数对的总数是 ^-1) = g 2 ~ go 因此，六个组织构成30个 
有序数对。由于篇幅所限，这里没有呈现所有的 P * 模型参 
数。有兴趣的读者可以参考安德森 ( Anderson ， 1999)、沃瑟 
曼和帕蒂森 (1996) 的相关文献。 

表 5. 1列岀了用于估计30个有序数对的 p * 参数的输 
入数据。下面的例子说明了是如何把这五个公式应用到一 
个有序对偶关系 (2-3) 中来计算输人数据的值的，这个有 
序对偶关系是表 5. 1中第7行从行为人2到行为人3的有向 
关系链。首先，通过当从行为人〖到行为人 J 的关系链存在 
时的关系链总数减去当从行为人 f 到行为人 j 的关系链缺失 

时的关系链总数，从而得到变量“选 择”： 

在这个例子中，对于每对对点，变量“选择”的值为1。因此， 
变量“选择”实际上是个常数，类似于模型中的截距。第二， 
同类组织内部的选择(从行为人2到行为人 3) 为1，因为如果 
从行为人2到行为人3的关系链存在，则同类组织内的选择 
总数为9;当这个关系链不存在时，同类组织内的选择总数为 
8。行为人3和行为人6之间的相互关系链和从行为人3到 
行为人4的有向关系链没有计算在内是因为这两对对点是 
不同类型组成的。第三，这个有向图存在五个相互关系链 
(1-2, 2—3, 3-6, 4—6, 4<-5)。当从行为人2到行为人3 

的有向关系链从存在变成缺失时，相互关系链的总数减少到 
4。因此，从行为人2到行为人3的相互关系变量值为5 _ 
4 = 1。第四，这个有向图存在四条同类组织间的相互关系链 
( W 2, 2^3, 4<->6, 4^5)，不包括行为人3和行为人6之间 
的相互关系链，因为这对对点是不同类型的。因此，当从行 
为人2到行为人3的有向关系链从存在变成缺失时，同类组 
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表 S.l p * 数据 


观察 

个体 


J 关系链选择 


同类间 

选择 


相互 同类间 梅、龟杜 
关系相互关系 


1 

1 


1 

1 


1 1 
1 0 


3 14 0 

4 15 0 

5 16 0 

6 2 11 

7 2 3 1 



9 

10 
11 
12 

13 

14 

15 

16 

17 

18 

19 

20 
21 
22 

23 

24 

25 

26 

27 

28 

29 

30 





0 

0 

0 

0 

0 

0 


0 

0 

1 

0 

0 

1 



0 0 
0 0 
0 0 


0 

0 

0 


0 

0 

0 


1 1 
1 0 


0 

0 

0 

0 


2 

3 

1 

0 

2 


0 

0 

0 


2 

2 

0 

3 

3 


0 

0 

0 

0 


3 

2 

2 

0 


0 

1 

1 

0 


3 

0 

1 

0 


0 


0 

0 

0 

0 


0 

3 

1 

3 


1 2 

0 3 


织的相互关系链总数从4减少到3,即减少了 4 — 3 = 1。第 
五，这个有向图有五种传递的关系[(1 — 2, 2 — 3, 1 — 3)， 
(1 3» 3 —► 2，1 -► 2) ， （2 -► 1» 1 3 j 2 —*■ 3) » (3 -► 6 ? 
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6 — 4, 3 — 4)，（3 — 4, 4 — 6, 3 — 6)]。当从行为人2到行 
为人3的有向关系链从存在变成缺失时，两种传递的关系 
(1 — 2, 2—3, 1 — 3) 和(2 — 1，1 — 3, 2 —3) 将消失。因 

此，这个传递性变量的值为2。总的来说，对于有序对点 
(2 — 3) 的五个计算如下 所示： 

选择的 变化 ： io 

同类组织间选择的 变化： 2 xp {J -办。， 13 -9 - 
8 = 1。 

相关关系链的变化： =5— 

4 = 1 0 

同类组织之间相互关系的变化； 而- 
^ i <： j JOijXjidi } =4 — 3 =1 0 

传递性的 变化 ： ^XijXjkXik - ^ j k X 

5 —3 = 2 0 

表 5. 1中的数据可以用 SPSS 、 SAS 和 STATA 等统计 
软件中的 logistic 回归来分析。因变量是二分变量“关系 
链”，对自变量——选择，同类组织间的选择，相互关系，同类 
组织间的相互关系和传递性——进行回归。回归结果如表 
5. 2所示。在这个模型中，只有一个解释变量——相互关系 
链——是显著的。包括从 i 到 j 的有向关系链在内的相互关 
系链每增加 一条“ 发送一条关系链到 j 的 odds 增加将近41 
倍 ( exp (3. 737)-1 = 40. 97). 控制其他解释变量后，一条相 
互关系链存在的 odds 是不存在的 odds 的41倍多 (Anderson 
et al . ，: 1999:54)。因此，这个有向图中关系链是互惠型的可 
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能性远远大于不是非互惠型的可能性。然而，互惠和选择对 
于不同类型的组织是不存在差异的，同类组织内的选择和同 
类组织内的相互关系都是不显著的。这个结果不支持项目 
支持在同类组织内比不同组织间更可能发生的假设。 


表 5. 2网络关系链的非标准化 logistic 回归 


变 量 

模型1 

变 量 

模型1 

选择 

-2. 208 

(1. 197) 

传递性 

-0. 408 

(1. 197) 

同类间选择 

2.741 

(2.183) 

卡方（自由度） 

19. 488… （4) 

相互关系 

3. 737* 

(1. 829) 

— 2 log likelihood 

20. 893 

同类间相互关系 

-1.588 
(2.921) 




注:括号里的是标准误。 * 表示/ 0. 05, * * 表示/> < 0. 01, * * * 表示 
p < 0 . 001( 双尾检验)。 


在社会网络分析方法中， P * 模型的发展标志着一个非 
常重要的进步。从此，社会网络分析不仅仅只是描述行为人 
之间的关系链，还可以解释行为人之间的关系链。模型也能 
清晰地模拟对图层特征和个体变量的关系链的影响。 P * 模 
型及其类似的模型在网络分析研究人员用来分析实际网络 
问题时将大有用处。许多实际介绍 P * 模型的教科书将有助 
于普及这种方法在网络研究人员中的应用。 
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第3节 | 隶厲网络 


隶属网络，也称为成员资格网络，表示一组行为人对一 
系列社会事件的参与 （Wasserman & Faust , 1994： 291 一 
343)。人们可以通过对社会活动的联合参与互相联结，或者 
因他们共同加人某一组织而互相联系。反过来说，社会事件 
因其共有的参与人而互相联结。隶属网络分析形象地展示 
了行为人和事件是如何同时相互联系的。 

一个隶属网络由两种类型的节点(一组行为人和一系列 
事件)和每个节点类型之间的一系列关系构成。因此，隶属 
网络是一种二模网络，这与连接行为人与行为人的一模网络 
不同。关于隶属网络的实际研究非常多 （Wasserman & 
Faust , 1994:196)。在第3章，我们讨论了弗里曼等人 
(1987) 关于大学教职工和学生参加九个座谈会的研究。研 
究者使用隶属网络来表示这些关系，其中参与人是行为人， 
座谈会是事件。其他一些大家熟悉的例子，有属于志愿者组 
织的成员、参加抗议活动的社会运动活动者、创立战略联盟 
的企业，以及签订军事协议的国家等。对二模网络的研究常 
常具有双重目 的: 揭示行为人之间通过共同参与事件而形成 
的关系 结构; 揭示事件吸引共同的参与人的关系结构。 
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隶属矩阵和二分图 


一个二进制隶属网络可以由一个隶属矩阵来表示，该矩 
阵记录 g 个行为人在^个事件中的参与和缺席。因此，它的 
维度分别是 g 行和&列。如果行为人 f 参与事件 j ，那么矩阵 
中第〖行第7列的单元格的元素等于1，否则元素为0。将这 
个二进制隶属矩阵命名为 A， 它的 Xd 值符合下述 条件： 

{1 如果行动者〖与事件 J 有关 

OCi，j = ^ 

'0 其他 


矩阵 A 的行总数，也称为行的边际值，记录每一个行为 

人所参与事件的总数 免工“” 列的边际值（；£%，』 ) 表示参 

. 1 ， 1 

与每一个事件的行为 i 的数量。 ； 



隶属网络也可以表示为二分图，其中无向线连接排列在 
图表一端的行为人和排列在图表另一端的事件。重要的是， 
二分图不允许行为人之间的连线和事件之间的连线。二分 
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图矩阵 ( B ) 在其行和列中包含行为人和事件。假设一个隶属 
网络有 g 个行为人和 A 个事件，那么 B 的维度为 (g + h ) X 

+ o 

图 5. 4是一个隶属网络的二分图，其中有五个行为人和 
三个事件。线条表示哪一位行为人参与了哪一个事件，同时 
也表示哪一个事件吸纳了哪一位行为人。虽然在这个图中 
行为人之间或事件之间没有直接的连线，但是它表明了行为 
人是如何通过他们共同隶属的具体事件而相互连接的。例 
如，行为人1和行为人2都参与了事件1，而行为人1、行为 
人3、行为人5则因事件2互相联系在一起。 

表 5. 3是对应于图 5. 4的一个二分矩阵，单元格的值为 
1表示一个行为人和一个事件相连。 

表 5. 3图 S. 4对应的二分矩阵 


al a2 a3 a4 a5 el e2 e3 小计 

0 0 0 1 1 0 2 

0 0 0 1 0 0 1 

- 0 0 0 1 0 1 

0 — 0 0 0 1 1 

0 0 — 011 2 

0 0 0 — 0 0 2 

10 10 — 0 3 

0 110 0 — 2 

1 1 2 2 3 2 — 

行为人 1 有两个 1 值，表明它参与了两个事件(事件1和 
事件2)。在右上角象限区内的 5 X 3 子矩阵，由行的五个行 
为人和列的三个事件构成，是一个隶属矩阵 A 。 左下角象限 
区是 A 的转置，表示为 Y ，其维度是3 X 5,且“ 
转置的隶属矩阵表明，行中的哪一个事件吸引了列中的哪一 
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位行为人。二分矩阵的另外两个象限的单元格的值总是为 
0,因为在二模数据中，行为人之间不直接连接，事件之间也 
是如此。二分矩阵可以简化为如下 形式： 

「0 A ] 

X A ’ E = [5. 6] 

La ， 0」 

在表格的边际上(并非矩阵的一部分)，行的总数等于列 
的总数。行为人总数表明它参与事件的数量，而事件总数则 
表明参与行为人的数量。 

将两个处于不同顺序的子矩阵 ( A 和 V )相乘，便得到额 
外的信息，即行为人之间的关系和事件之间的关系，而这在 
二分矩阵中是没有的。首先， XA 是一个行为人对点共同出 
席的陚值的对称矩阵，由两个矩阵相乘 获得： 

X A = AA / [5. 7] 

一 般来说，隶属网络 A 是一个 gXh 矩阵，而它的转置 
A ' 是一个 AXg 矩阵。因此， X A 总是一个 gXg 矩阵，它的非 
对角线单元格的值是行为人 i 和 j 共同参与的事件数量 。 A 
的对角线元素表示每一个行为人参与的事件数量。其次 ， XE 
是一个事件对点共同参与的赋值的对称矩阵，由两个矩阵相 
反相乘 获得： 


X E = A'A [5. 8] 

这个 hXh 矩阵的非对角线单元格的值，是同时参与事 
件〖和7‘的行为人数量。而八'矩阵的对角线元素，是参与每 
一个事件的行为人数量。 

案例数据的共同出席矩阵图如下 所示： 
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X A = AA ; = 


'110、 


， 2iior 

100 


'11000、 


11000 

010 

X 

10101 

—— 

10101 

001 


.0001 L 


00011 

.011, 


L 10112, 


[5. 9] 


五个行为人和三个事件形成的 X A 是一个5 X 5的对称矩 
阵，其非对角线单元格的值表示每一对点参与事件的数量。 
如第一行所示，行为人1与行为人2、行为人3和行为人5各 
参与一个事件，但未与行为人4参与事件。对角线表明，行为人 
1和行为人5各参与两个事件，而其他人则只参与了一个事件。 
案例数据的共同参与矩阵如下 所示： 


X E = A^A ™ 



，110、 

，11000、 


100 

10101 

X 

010 

,00011, 


001 

1 

,011> 


，210、 

131 [5.10] 

, 012 , 


这个 3 X 3 的对称矩阵的非对角线单元格表示参与每对 
事件的行为人数量。事件1和事件2只有一个共同的行为 
人(其中行为人1同时参加了这两个事件)，但是事件1和事 
件3没有共同的行为人。对角线值反映，事件2吸引了三个 
行为人(行为人1、行为人3和行为人 5) 。 

在分析的网络层次上，隶属的平均率值是可以从两个乘 
积矩阵值计算出来的。因为 XA 的对角线元素是每一个行为 
人参与事件的数量，因此将它们加起来，然后除以行为人 ( g ) 

S 

的数量，即得到平均的行为人参与率又 A = 22。在这个 

g 
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E 

例子中，平均有 ( y )= 1.40 个行为人参与每一个事件。同 
样，将 X E 的对角线值相加，除以事件⑹总数，即得到平均的 

k 

y^xj, i 

事件参与率又 E = 在这个例子中，平均的事件参与 

率是 ( y )-2. 33个行为人。 

隶属网络的密度和中心度 

密度和中心度是非常重要的基本网络特征，它们也能够 
适用于隶属网络。正如在第4章所讲的，密度测量反映二进 
制图中联结出现的比例，或者反映赋值图中可观察到的线的 
平均值。同样地，对隶属网络密度的阐释也依赖于该网络是 
否为二进制图或赋值图 (Wasserman & Faust , 1994:316)。 

对于共同参与的 gXg 对称矩阵 XA 来说，其非对角线值 
是每对行为人参与事件的数量，其密度计算公式 如下： 

z g 

= …） [5 * 11] 

在公式 5. 11中，分子表示共同出席矩阵中上三角阵中 
所有值的总和（即对角线以上的部分,因为下部分三角的值 
是相同的）。因为我们不可能认为一个行为人与他自己共同 
参与某一事件，所以我们排除了对角线上的值。分母是无序 
对点的所有数量，当然也排除了对角线上的值。对于共同参 
加的 / iXA 对称矩阵 XE 来说，其非对角线上的值是每一个事 
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件中参与的行为人数量，其密度计算如下 所示： 

±±xf tJ 

在这个例子中 ， M = 5/10 = 0.50, 意味着每对行为人 
共同参与了平均半个事件。从事件角度来看 ， DE = 2/3 = 
0.67,表明平均每对事件吸引了 2/3个行为人。由于乘积矩 
阵单元格的值可能大于1，因此密度值也可能大于1.0。因 
此，每一个密度值不应解释为一个比例，而应该分别解释为 
每两个行为人所出席的事件平均数 ( EA ) ，或每两个事件中的 
平均参与人数(以）。 

社会网络分析在行为人的分析层面研究中心度，在图的 
分析层面研究中心度，这种研究已经进行了数十年 （ Free ¬ 
man ， 1979; Wasserman &• Faust , 1994:第3章）。我们在第 

4章讲过，行为人中心度测量一个网络之内行为人的重要性 
或显性。根据研究者定义重要性和显性的不同，可以将中心 
度分为四种主要的类型 :程度 、亲密性、中间性和特征向量中 
心度。程度中心度反映行为人在网络中活动的积极 程度; 亲 
密性中心度测量一个行为人通过网络内最短路径与其他行 
为人联结的 程度; 中间性中心度捕捉一个行为人对网络其他 
行为人之间的信息或资源流的居间 程度; 特征向量中心度反 
映行为人与网络中的其他中心行为人的联系程度。浮士德 
(1997) 讨论了这四种中心度测量方法在隶属网络中的运用， 
但在此由于文本篇幅的限制，我们只讨论隶属网络中程度中 
心度的使用。 

一般认为，程度中心度包含有向联结的总数，因此隶属 
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网络的行为人程度中心度便是行为人联系的总数，即第〖个 
行为人出席所有事件时所接触到的联结数量，由共同出席的 
矩阵 X A 的第 f 个行值相加 所得： 

C^iaO = [5.13] 

j=i 

在这个例子中，行为人1分别与行为人 2、行为人3 和行 
为人5 —起参与了三个不同事件，因此它的程度中心度是3。 
行为人2的程度中心度更低，因为它只与行为人1参与过第 
1个事件。 

同样地，隶属网络中一个事件的程度中心度是事件联系 
的总数，即第 J 个事件通过所有行为人的参与而得到的联结 
数量，由共同参与矩阵 XE 的第 J 个列值相加 所得： 

h 

ClieO = •关 j ) [5. 14] 

在这个例子中，三个事件的程度中心度分别为1、2、1。 
事件2的程度中心度值最高，因为通过至少一个共同的行为 
人的参与，从而与事件1和事件3都有了联结。而事件1和 
事件3则只与事件2共享行为人。 
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第 4 节1点阵 


上面所讨论的隶属网络，一个明显优势就在于可以看见 
二模数据网络结构的三种类型 :行为 人一事件关系及其转 
置，通过共同参与事件而构成的行为人之间的关系，通过吸 
引共同行为人而构成的事件之间的关系。然而，隶属网络的 
二分图形式不能揭示行为人和事件节点二者是如何相关的。 
伽罗瓦点阵 (Galois lattices) 提供了一个二模数据的一般表 
述，使得同时査看两个模式之间的关系成为可能，为观察网 
络的结构特征提供了有价值的研究视角 (Freeman & White, 
1993； Wasserman &* Faust, 1994：326 一 342)。 在实证研究 

中,该方法运用于下列关系的研 究：中 国革命年代的村民和 
政治冲突 ( Schweizer ，1996) 、济贫机构为贫民提供的救济和 
待遇 (Mohr Duquenne , 1997)，以及1992年巴西弹劾运动 
中的组织和事件 (Mische & Pattison , 2000) „ 

伽罗瓦点阵 


伽罗瓦点阵，因19世纪法国数学家埃瓦里斯特 • 伽罗 
瓦戊 variste Galois ) 的论著而得名，也称为伽罗瓦连接 ( Ga ¬ 
lois connection )， 是两个有序集合之间的连接。在网络运用 
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中，伽罗瓦点阵有两个非空 集合: 行为人集合 A 和事件集合 
E 。 这两个集合通过二模隶属网络连接，表示行为人是如何 
与事件相连的(反之亦然）。因此，一个伽罗瓦点阵由一个三 
元组 ( A ， E ， I )构成，其中 I 是矩阵 AXE 中的二进制关系。 
表 5. 3中二分矩阵的子矩阵 A 是一个行为人一事件矩阵的实 
例。现在考虑 P ( A ) = { Ai , A 2 , …}，这是一系列矩阵 A 
的 集合； P ( E ) = { Ei , E 2 , …} ，这是一系列矩阵 E 的集合。 
I 关系定义为从 P ( A ) 至 P ( E ) 的 映射: Br-B 个： 

丑个= { e ^ EUa , e ) G J ， 所有 a 6 A } [5.15] 

这个数学公式表明，映射图能够识别某一特定行为人或 
某些行为人所隶属的所有事件。尤其是， t 映射从一系列行 
为人到一系列事件，其中这些行为人隶属于这些事件 ( Was - 
serman & Faust , 1994:330)。例如，表 5. 3中的子矩阵 A 表 

示，行为人1隶属于事件1和事件2,而行为人1和行为人2 
都隶属于事件1。 

反过来，这个映射能够从 P ( E ) 至 P ( A ): F — 

F { = {a G A | ( a , 6 I ，所有 e ^ E } [5.16] 

公式 5. 16意味着映射应当确认一个具体事件所吸引的所 
有行为人。表 5. 3中的子矩阵 A 显示，事件2吸引了行为人1、 
行为人3和行为人5,但事件2和事件3只吸引了行为人5。 

将两个映射图合并起来，伽罗瓦点阵展现了一系列行为 
人是如何隶属于一系列事件的。在图表中的每一个点，既表 
示一系列行为人，也表示一系列事件。为了解释伽罗瓦点 
阵，需要在一个一致的方向上移动:（1)为了跟踪出席事件的 
行为人，只需要向上移动，将点阵从底端升至 顶端； （2) 为了 
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跟踪吸引了行为人的事件，只需要向下移动，将点阵下降。 
依照惯例，点阵上面部分涵盖了行为人集合 A 的全部要素， 
下面部分涵盖了行为人集合 E 的全部要素。图 5. 5展示了 

表 5.3 当中隶属矩阵的伽罗 
瓦点阵图。这个图将三个事 
件标示为 A 、 B 、 C ， 将五个行 
为人标示为1、2、3、4、5。 
该点阵底部聚集了最多的事 
件。沿着点阵向上移动，会逐 
渐遇到行为人集合的增大和 
事件集合的缩小。在底端的 
起始点，包含所有的事件 
( ABC )， 但行为人集是空的 
(多)，因为没有人参与所有的 
事件。向上一点，点阵图显示，事件 A 和事件 B 共享行为人 
1，事件 B 和事件 C 共享行为人5。再往上，事件集合变得更 
小，但行为人集合变大。事件 A 吸引了行为人1和行为人2, 
而事件 B 吸引了行为人1、行为人3和行为人5，事件 C 吸引了 
行为人4和行为人5。点阵最顶端罗列了所有的行为人但没 
有任何事件，这表明没有事件吸引所有的网络行为人。一般 
来说，如果接收到从事件处下降之线条上行为人是人射的，那 
么该行为人隶属于该事件。在以事件 A 和事件 B 为出发点的 
线条上，行为人1是入射的，表明行为人1隶属于这两个事件。 
相反，在从行为人处升起之线条上是人射的事件，吸引了这些 
行为人。例如，事件 C 在由行为人5处升起之线条上是入射 
的，表明事件 C 吸引了行为人5。事件 B 收到来自行为人1和 
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BC /5 


图 S .5 隶属网络的伽罗瓦点阵 
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行为人5的线条，表明这两个行为人都参与了事件 B 。 

伽罗瓦点阵也表示一些事件之间的隶属模型和行为人 
之间的隶属模型。例如，图 5. 5显示，行为人2没有参与任何 
无行为人1参加的其他事件(行为人2只参加了事件 A ， 行为 
人1也隶属其中)。同样，行为人4只参加了事件 C ， 该事件也 
吸引了行为人5。相反，行为人1或行为人5都没有限制自己 
参加同样吸引了行为人2或行为人4的事件。也就是说，对于 
行为人1或行为人5来讲，参与某个事件并不以其他行为人 
的参与为条件。从事件的角度来看，图 5. 5也显示，三个事件 
集合中的行为人有重叠但不相同，在此意义上三个事件都包 
含不同的行为人集合。含有更多行为人和事件的更复杂网 
络，也许会发现一些包容性结构，其中在某一个事件中出现的 
行为人也出现在其他的事件里 (Freeman White ， 1993)。因 
此，所有三种连接类型——行为人一事件关系、行为人一行为 
人关系、事件一事件关系——的数据都能够用伽罗瓦点阵进 
行精确重组。 

使用伽罗瓦点阵对三种关系类型的结构特点进行同步 
分析，尽管这是一个非常明显的优势，但是它的应用只限于 
表述小型的二模网络数据集合。关于这方面，伽罗瓦点阵类 
似于图，其主要的运用是展示数据，而不是还原数据。大型数 
据集合，一般包含高度复杂的结构，会迅速搅乱伽罗瓦点阵的 
可视性。即使利用简化符号，如弗里曼和怀特 (1993) 所建议 
的那样，观察者依然很难看清楚复杂的伽罗瓦点阵的图像。 

网络小团体的伽罗瓦点阵 


网络分析者认为，一些统计的或代数的数据还原方法可 
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以被用于简化伽罗瓦点阵的可视化图像 ( Duquenne ， 1996； 
White , 1996)。弗里曼（19%)认为，伽罗瓦点阵能够帮助展 
示社会行为人之间的小团体。经典的卢斯一佩里 ( Luce * Per - 
ry ) 小团体定义假定存在一个关于社会关系 R 的二进制对称 
平方矩阵 ( A 2 )。 小团体 C 是一个含有三个或多个行为人的 
最大子集，其中每对行为人都由 R 连接。“最大”意味着没有 
小团体能涵盖在一个更大的小团体中。然而，在实践中，小 
团体往往太小、太多或者太过于重叠，以至于不能反映社会 
群体的直观结构 ( Freeman ， 1996:174)。伽罗瓦点阵方法运 
用于小团体结构的可视化处理，需要用小团体集替代事件 
集。之前我们讲到过，伽罗瓦点阵由一个三元组 ( A 、 E 和 I ) 
构成，其中 A 是行为人集， E 是事件集， I 是 A X E 中的二进 
制关系。如果将伽罗瓦点阵应用于小团体，那么伽罗瓦点阵 
将被重新定义为另一个三元组 ( A 、 C 和 I ),其中 A 和 I 的意 
义不变， C 表示小团体的集合。 

遵循事件的伽罗瓦点阵的相似布局，小团体伽罗瓦点阵 
将较大的小团体集合放置在下部，将较大的行为人集合放置 
在上部。假定图 5. 5现在表示的是一个小团体伽罗瓦点阵， 
而不是一个事件伽罗瓦点阵，那么在底部有三个小团体 
ABC ， 其零值表示没有行为人属于这三个小团体。沿着点阵 
往上走，我们可以发现，小团体越少，行为人集合越大。行为 
人1 同时属于小团体 A 和小团体 B ， 而行为人5同时属于小 
团体 B 和小团体 C 。 继续往上走，可以看到小团体 A 包含行 
为人1和行为人2,小团体 B 包含行为人1、行为人3和行为 
人5,而小团体 C 包含行为人4和行为人5。行为人的全体 
集合位于图的顶端，是个空集，表示没有一个小团体同时包 
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,含所有五个行为人。 

弗里曼 (1996) 讨论过小团体网络伽罗瓦点阵的几个重 
要结构特征。首先，两个重叠小团体由下降线连接，交会于 
点阵图低处某个标签点，而两个非重叠小团体则仅在无标签 
泛下限处与空集(幻连接。假设图 5. 5反映的是一个小团体 
网络的伽罗瓦点阵，小团体 A 和小团体 B 交会于一个标有行 
为人1的较低点，表示两个小团体出现重叠，共享了行为人 
1。相反，小团体 A 和小团体 C 没有重叠，表示它们的交会点 
是在无标签的泛下限点。 

其次，弗里曼 （1996) 利用多种重要维度(如链、长度、高 
度和深度），对小团体点阵的个人行为人的位置按特点进行了 
归纳。链是指由一个元素引至另一个元素的全部上升线或下 
降线所组成的序列。链的长度是链所包含的线条的数量。行 
为人的高度是从泛下限点上升至该行为人处的链的长度。相 
反，行为人的深度是从泛上限点下降至该行为人处的链的长 
度。因此，处于点阵低处的行为人具有较大的深度和较小的 
高度，而处于点阵顶部的行为人具有较大的高度但是较小的 
深度。深度较大但高度较小的行为人深嵌在网络中。他们参 
与多个小团体，但他们与这些小团体的隶属关系独立于其他 
行为人的隶属关系。从某种意义上来说，他们构成了这个小 
团体的核心成员。相反，高度较大但深度较小的行为人则往 
往浮在网络表层。他们与某个小团体的隶属关系往往取决于 
其他行为人的隶属情况。因此，他们属于这个小团体的边缘 
人物。将这些观点套用于图 5. 5,我们就能够确定行为人1和 
行为人5分别是小团体 AB 和小团体 BC 的核心成员，而行为 
人2、行为人3和行为人4则是这些小团体的边缘人物。 
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对应分析 


上面讲的点阵分析是运用代数方法展示隶属网络的代 
表，而对应分析则利用度量技术来联合展现隶属网络中所有 
的行为人和事件 （ Faust ， 2005； Wasserman &- Faust ， 1994: 
291一343)。对应分析主要通过奇异值分解 （Singular Value 
Decomposition , SVD ) 的数学方法进行。我们这里只简要地 
介绍一下 SVD ， 集中谈论与隶属网络矩阵有直接关系的几个 
事项(欲知详情，请参阅 Strang ， 1988)。 

SVD 是矩阵 A 的分解，其维度有 gX A : 

A = X A Y T [5.17] 


这个公式含有 A ，它表示奇异值的对角线矩阵 { Ak};X 
表示大小为 gXh 的左奇异向量 矩阵; Y 表示大小为 /I X /I 的 
右奇异向量矩阵。因此，左奇异向量指矩阵 gx / i ， 右奇异向 
量指矩阵 AXA 。 奇异值的数量也被称为秩，通常表示为 w 。 
SVD 利用秩 W 来度量视图中的行为人和事件，将它们排列 
在 A 的合适位置中。 

对应分析中的 SVD 包括对标准化后的矩阵 A 的分解。 
标准化有两种方法: （1) 将原始矩阵 A 的元素除以行和列边 
际总数乘积的平方根； （2) 计算矩阵 A 和两个对角线矩阵 
R -士 和 C _ + 的乘积 ( Faust ， 2005)，其中 

= diag ( ~3—— 



diag ( 



[5.19] 
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将三个矩阵相乘，得到矩阵 A 的标准化形式，标准化矩阵 A 
的获得也可以通过如下 方法: 用矩阵 A 的元素除以行和边际 
总数乘积的平方根。对应分析包含乘积矩阵的 SVD ： 

R-iAC-i = X 八 YT [5. 20] 

对应分析获得三个信息集 合:行 矩阵的 g 值集合 U = 
{uik } »其中 i = 1，2，… g ， 是=1，2,…列矩阵的 A 值集 
合 V = {呼 } ，其中 j = 1，2,…/ I ，々=1，2,…* it ；; 奇异值 
八={^}，其中是=1，2,…您，表示每一个维度的重要性。 
为了获得一个所有行和列元素的联合展示，对应分析将行为 
人的值计算为其所隶属的事件加权平均值的函数，将事件的 
值计算为它的行为人值的加权平均值的 函数： 

h 


huik = 

)=1 山 + 

[5. 21] 

Xkvjk = 

y-i d+j 

[5. 22] 


在上述两个公式里， ay 是原始矩阵 A 中第 f 行和第 j 列 
的单元格的值。 

为了讲解的便利，我们利用前面的隶属网络数据 :五个 
行为人和三个事件。表 5. 4表示原始版和标准化版的矩阵 
A 。 表 5. 5列出了标准化矩阵 A 的 SVD ， 它得到三个数据 
集合叫、％和 Ak 。 行为人值是其所隶属的事件值的一个 
函数。同样，事件值是其所吸引的行为人值的一个函数。 
具体来讲，在第一维度行为人1的值(一 0. 661) 是由该行为 
人隶属的两个事件的加权平均值除以奇异值 （ Ai ) 得出： 

■y X ( — 1.146) + 4- X 0 

--~~-^ =-0. 661。同样，在维度1中事件 
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1的值(一 1.146) 是由事件所吸引之行为人 (1 和 2) 的加权平 


均值得 来的: 


j X ( — 0. 661) + j X ( — 1. 323) 


0. 866 


1. 146 


那么，你能计算出其他行为人和事件的值吗? 


表 5. 4隶厲网络的矩阵 A 



el 

el 

e3 

隶属矩阵 A 

al 

i 

1 

0 

a2 

i 

0 

0 

a3 

0 

1 

0 

a4 

0 

0 

1 

a5 

0 

1 

1 

标准化矩阵 A 

al 

0. 5 

0.408 

0 

a2 

0.707 0 

0 

a3 

0 

0.577 

0 

a4 

0 

0 

0.707 

a5 

0 

0. 408 

0. 5 


图 5.6 给出了隶属网络的对应分析。括号内的数是两 
个维度的值，等于表 5. 5中的数。 X 轴和 Y 轴分别表示第一 
和第二维度 ( A )。 在图中，行为人1隶属于事件1和事件2, 
行为人5隶属于事件2和事件3,处于两个维度的中心，因此 
位于图表的中央。事件2位于第一维度的中心，主要是因为 
它吸引了大多数行为人(1、3和5)，但是它离第二维度的中 
心要比事件1和事件 3( 每个事件只吸引了两个行为人)远一 
点点。行为人3位于第一维度的中心，因为它隶属于中心事 
件(事件2)，但是行为人3在第二维度中的位置却是最边缘 
的，也许是由于它只参与了一个事件。行为人2和行为人4 
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在两个维度中都处于边缘，反映他们只参与了一个事件。同 
样，事件1和事件3在两个维度中也是位于边缘，表明它们 
比事件2吸引的行为人要少一些。 


表 5. 5隶属网络的对应分析主坐标 


维度 (TO) 

1 

2 

行为人 / 行值 ( 叫） 

A1 

一 0. 661 

-0. 144 

A2 

— 0. 323 

0.866 

A3 

0. 000 

— 1.155 

A4 

1,323 

0. 866 

A5 

0.661 

-0. 144 

事件 / 列值 ( 印） 

E1 

一 1. 146 

0. 559 

E2 

0 

一 0. 745 

E3 

1. 146 

0. 559 

奇异值 OU) 

0. 866 

0. 645 


i 



1.59 

- 


1.27 

* 



A 2 

A 4 

0. 95 

- C -1. 32, 0.87) 

(1.32, 0.87) 

° E 1 

E 3 ® 

0.63 

.(一1.15, 0.56) 

(1. 15, 0.56) 

© 

Q 

0.32 

■ 


A 1 

A 5 


( — 0. 66，— 

0.14) (0. 66, -0.14) 

0. 00 

- © 

© 

— 0. 32 


E 2 

一 0. 63 

- 

(0.00, -0. 75) 

© 

A 3 

-0.95 


(0.00, 一1. 15) 

% 

-1.27 

* 


-1.59 

* 

1 1 _ 


-1.59 一 0.95 -0.32 0. 32 0.95 1.59 


图 5. 6 S - 行为人和3■事件隶属网络的对应分析 
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结论 


在前面有关章节中，我们讨论了一些网络分析的方法 
(聚类分析、 MDS 和相应分析)。这些方法在用于非网络数 
据的分析时具有明显的优势。例如，韩 (2003) 利用加权 MDS 
法，分析了 1993年综合社会调査数据中受访者的音乐爱好。 
虽然收集社会网络数据耗时费力，尤其是采用全幅网络设计 
时，但社会调查数据却比较容易获得，可以用这些网络分析 
方法对它进行分析，以揭示潜在的关系。社会网络分析为研 
究者提供了有力的分析概念和工具方法。最近有一项研究 
非常娴熟地运用了聚类分析方法，将中欧东部地区1586个 
市民社会网站根据13个变量分类成六个维度 （ Vedres ， 
Bruszt Stark , 2004)。另 一 项研究 ( Mohr ，1998) 则直接讨 

论如何将 MDS 、 聚类和对应分析等方法用于对复杂结构进行 
简化，对不同文化背景之间的一些深层结构逻辑进行可视化 
处理。这些研究展现了多种社会网络方法的熟练应用，也正 
好表达了我们本书所追求的最终目的——鼓励读者朋友努 
力学习社会网络分析，以洞悉结构关系之谜。 
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译名对照表 


actors 

行为人 

alters 

行为客体 

actor contacts 

行为人联系 

adjacency matrix 

邻接矩阵 

advice-seeking network 

建议寻求网络 

affiliation matrix 

隶属矩阵 

affiliation networks 

隶属网络 

Americans' core discussion groups 

美国人的核心讨论圈 

analysis of lattices 

点阵分析 

archival documents 

档案资料 

a single inclusive cluster 

单一的全涵盖聚类 

asymmetric choice 

非对称选择 

attributes 

特征 

authority/power relations 

权力关系 

automorphic equivalence 

自形等价 

average link 

平均联结 

average method 

均值法 

betweenness 

中间性 

betweenness centrality 

中间性中心度 

binary nondirected 

二进制无向 

binary directed 

二进制有向 

bipartite graph 

二分图 

blockmodel 

块模型 

boundary penetration relations 

交叉关系 

boundary specification 

范围界定 

bridge 

桥 

cascade modules 

级联模块 

categoric variables 

分类变量 

centrality 

中心度 

chain-referral method 

连锁推荐法 

chaos theory 

混沌理论 



译名对照表 


checklist 

提名清单 

checklist method 

名单核对法 

circuit 

回路 

clique 

小团体 

clique size 

小团体规模 

closed walks 

封闭行程 

closeness 

亲密性 

closeness centrality 

亲密中心度 

cluster 

群 

clustering 

聚类 

clustering algorithms 

聚类演绎法 

cognitive maps 

认知图 

Cognitive Social Structure (CSS) 

认知社会结构 

cohesion 

内聚力 

cohesiveness 

内聚 

cohesive subgroup 

内聚型亚群体 

communication relations 

沟通关系 

complementarity hypothesis 

异性相吸的互补假设 

complete link 

完全联结 

complete reliability 

完全可信 

complete networks 

全幅网络 

complete network measures 

全幅网络测量 

complex theory 

复杂理论 

components 

组成部分 

Compute 尸 Mediated Communication (CMC) 

电子化交流 

computer-monitored network data 

计算机控制网络数据 

connection 

连接 

consensus formula 

共识模型 

contact 

接触 

correspondence analysis 

对应分析 

cutpoints 

分界点 

degree centrality 

程度中心度 

dendrogram 

树形图 
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density cutoff 

density matrix 

diameters 

digraph 

digraph clique 

directed dyadic relations 

directed graph 

direct relation 

dissimilarities 

diversity 

divisiveness 

descriptive statistics 

dispersion 

drawn sociograms 

dyad 

dyadic network 
dyadic relation 
dyadic units 
ego 

ego actor 

egocentric analysis 
egocentric networks 
egocentric network measures 
ego-density 
eigenvector centrality 
error term 
Euclidean distance 
event 

event-based strategies 
event contacts 
expansiveness 
faction 
first zone 


密度临界值 
密度矩阵 
直径 
有向图 

有向图小团体 
有向对偶关系 
有向图表 
定向关系 
异质性 
多样性 
分裂性 
描述统计学 
离差 

手绘社会关系图 
对点 

对偶网络 
对偶网络关系 
对偶组合 
行为主体 
主体行为人 
自我中心分析法 

自我中心网络 

" 

自我中心网络的测量 
自我密度 
特征向量中心度 
误差项 
欧氏距离 
事件 

基于事件的策略 
事件联系 
扩展程度 
派系 

第一关系圈 



译名对照表 


fixed list approach 
fixed list selection 

'，、 、 、"：:■‘、;>> 二乂 v .) 

frequency 

galois connection 
gang 

General Social Survey(GSS) 
geodesic distance 
geographical constraint 
graphs 
graph theory 

. 

... ； ... ’ 

group closeness centralization 

group degree centralization 

hierarchical agglomerative cluster analysis 

濟 〆 , " 在 If: ^ 、 / ' 

hierarchical clustering 

high degree-seeking strategy 

homophily hypothesis 

: s :. 邊 ㈣ 汽:纖 ::键 . 汶今 S ::: 备 4 

man capital 

indegrees 

Index of Qualitative Variation(IQV) 
Individual Differences Scaling( INDSCAL) 
informant bias 
initial sample 
initiators 

instrumental name generator 
instrumental relations 
instrumental ties 
intensity 

interlocking roles 
internal consistency reliability 
interobserver reliability 
isolated structures 
isomorphism 
isomorphic equivalence 





固定名单法 
固定名单选择法 
频率 

伽罗瓦连接 
帮派 

综合社会调査 
测地距 
地域限制 
图表法 
图论 

组亲密中心度 
组程度中心度 
分层聚类分析 
分层聚类法 
髙相关度寻找法 
羽禽群居的同质假设 
人力资本 
节点入度 
定性变化指数 
个体差异标度 
信息偏差 
初始样本 
发起人 

工具性提名生成法 
利用关系 
工具性连接点 
强度 

互锁角色 
内在一致性信度 
观察者间信度 
孤立结构 
同质性 
同构等价 
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isomorphic subgraphs 
Jaccard’s coefficient 
jointly dyadic property 
K-core method 
Kevin Bacon game 
kinship and descent relations 
labeled points 
lattices 

longitudinal information 
matrices 

maximal complete subgraph 
mean egocentric density measure 
mean sex diversity 
measurement of relations 
missing data 

MultiDimensional Scaling(MDS) 
multiple-narae generator methods 
multiple networks 

multiple social support name generator 

mutualchoice 

name generators 

name interpreters 


同构子图 
Jaccard 系数 
共同的对偶特征 
K 核心法 
凯文 • 培根游戏 
亲属关系 
标示点 
点阵 

纵向信息 
矩阵法 

最大完全子图 
自我中心网络密度测量均值 
性别多样化均值 
关系测量 
数据缺失 
多维标度 
多个提名生成法 
多重网络 

多重社会资源提名法 
双向选择 
提名法 
姓名阐释法 


National Longitudinal Study of Adolescent Health 


m m • 

network position measures 
network sampling 
network size 
network structure 
nodes 

nodal degree 
nodal indegree 
nodal outdegree 
nodal response rate 


美国青少年健康纵向调查 

网络位置测童 

网络抽样 

网络规模 

网络结构 

节点 

节点度 

节点入度 

节点出度 

节点应答率 
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nominalist strat^ies 
nontdirected graph 
nondirected dyadic relations 
nonoverlapping clusters 
nonreciprocal relations 
normalized actor d 雄 ree centrality 
numerical constraint 
one-mode network 
online social networking 
ordinary least square regression methods 
pair characteristics 
paths 

Pearson s correlation coefficient 
points 


^： ty 







positional generators 
positional strategies 
prestige 

realist strategies 
receivers 
receptivity 
regular equivalence 
relational response rate 
relational strategies 
relationship measures 
reliability 

reputational method 
resource generators 
respondent-driven sampling 
Reverse Small-World method (RSW) 

role/content constraint 
r k* 

sampling bias 




唯名论界定策略 
非定向图 

非定向的对偶关系 
非交叉聚类 
单向关系 
标准化行为人程度中心度 
数量限制 
一模网络 
在线网络交流 
最小二乘回归法 
二元特性 
路径 

皮尔逊相关系数 
点 

受欢迎程度 

位置 

位置选择法 
定位策略 
声望 

唯实论界定策略 
接收者 
接纳程度 
正规等价 
关系应答率 
关系策略 
关系的测置方法 
信度 
声望法 
资源选择法 
应答驱动抽样 
反向小世界方法 
角色/内容限制 
抽样偏差 
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sampling frame 
sampling units 
saturated structures 
seciometry 
self-relation 

seif-report questionaire surveys 

sender-receiver 

sentiment relations 

similarity 

single link 

single-name generator methods 
singleton cluster 

Singular Value DecompositionCSVD) 

six degree of separation 

small-world idea 

small-world phenomena 

snowball sampling 

social capital 

social cognitive structure 

social identity approaches 

social resources theory 

sociai support networks 

socic^ram 



sociometric 

sociometric techniques 
source-target 
split-half reliability 
standard deviation 

standard deviation for continuous variables 

star graph 

strength 

stress 


抽样框 
抽样单位 
饱和结构 
社会计量法 
自我关系 
自填式问卷调査 
发送者一接收者 
情感关系 
相似性 
单个联结 
单个提名生成法 
单独的聚类 
奇异值分解 
六度分隔 
小世界理论 
小世界现象 
滚雪球抽样法 
社会资本 
认知社会结构 
社会认同途径 
社会资源理论 
社会支持网络 
社会关系图 
社会矩阵 
社会计量学 
社会计量方法 
源头一目标 
折半信度 
标准差 
连续变量的标准差 
星形图 
力度 
应力 
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strongly connected 

强连接 

structural equivalence 

结构等价 

structural relations 

结构关系 

structurally equivalent actors 

结构等价的行为人 

subgraph 

子图 

subgroup 

亚群体 

substantialist approaches 

实体论方法 

subsystem 

子系统 

summation method 

求和法 

temporal constraint 

时间限制 

terminators 

终结者 

test-retest reliability 

再测法信度 

total network 

全部网络 

transaction relations 

交换关系 

tree diagram 

树图 

triadic relations 

三元关系 

two-mode network 

二模网络 

type of tie 

连接模式 

unilaterally connected 

单向连接 

utility 

效用 

valued directed graph 

赋值有向图 

valued graph 

賦值图 

valued nondirected graph 

赋值无向图 

visual displays 

视觉演示 

、.二 ；■； 、 

weak connect^! 

弱连接 

Weighted MultiDimensionai Scaling(WMDS) 

加权多维标度 

• 
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